Query Anonymization for MongoDB

Pires, Hélio Bento Renato

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87943

DC Field	Value	Language
dc.contributor.advisor	Cabral, Bruno Miguel Brás	-
dc.contributor.author	Pires, Hélio Bento Renato	-
dc.date.accessioned	2019-11-18T23:26:23Z	-
dc.date.available	2019-11-18T23:26:23Z	-
dc.date.issued	2019-09-11	-
dc.date.submitted	2019-11-18	-
dc.identifier.uri	https://hdl.handle.net/10316/87943	-
dc.description	Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	Existe cada vez mais recolha de dados para análise. Grande parte dos dados contém informações pessoais. Soluções de anonimização são essenciais para que a privacidade possa ser garantida aquando a publicação de dados. Isto aumenta a procura de soluções de anonimização dinâmicas, pois precisamos de sistemas que conseguem operar sem constante necessidade de supervisão humana.Critérios de anonimização como privacidade diferencial são assegurados por algoritmos e oferecem garantias mensuráveis de anonimização. Utilizamos implementações desses algoritmos providos através da API do ARX para o desenvolvimento duma ferramenta de anonimização dinâmica. Pretendemos atingir a anonimização de dados mantendo os tempos de respostas o mais rápido possível.Esta ferramenta foi utilizada para investigar a viabilidade dessa abordagem para anonimização de \textit{queries}. Foi utilizado para caracterizar anonimização de queries. Executamos varias \textit{queries} com vários algoritmos de anonimização recolhendo os dados sobre esse processo para posterior análise exploratória de dados. O principal objetivo é o estudo do \textit{trade-off} entre privacidade e utilidade dos dados no contexto das \textit{queries}. Esses dados também são utilizados para validar nosso sistema.A principal vantagem de anonimização de queries segundo nossa abordagem é a precisão das queries. Pois elas são feitas a uma base de dados não anonimizada. Esta solução pode responder a queries em tempos aceitáveis se essas não tiverem uma dimensão elevada ou se o algoritmo usado para privacidade diferencial. Da perspetiva de utilidade de dados a anonimização estática é ligeiramente mais eficiente entretanto para o algoritmo t-closeness a nossa solução teve melhor desempenho. Temos que levar em consideração que a nossa solução acrescenta mais funcionalidades extras.	por
dc.description.abstract	Data is being collected and analyzed at an unprecedented scale. A big part of the data being analyzed contains personal information. Anonymization solutions are essential, so privacy can be protected when publishing personal data. This increases pressure for the development of dynamic anonymization systems as we need systems that can operate without constant human supervision. Anonymization standards like differential Privacy can be provided by algorithms and offer measurable guarantees of privacy. We used the algorithms provided by to develop a dynamic anonymization system. We intend to achieve data anonymization keeping response time as fast as possible.Our solution was used to investigate the viability of this approach to query anonymization and study its characteristics. We execute multiple queries with different anonymization algorithms while collecting data for subsequent exploratory data analysis. The main goal was to study how the trade-off between privacy and data utility behaves under query constraints. Also, with this information perform the validation of our system. Our approach to query anonymization has the advantage of query precision as we are querying before anonymizing. This solution can respond to queries in responsive time if the queries are not too large. From a data utility standpoint anonymizing the whole database is slightly better except for the t-closeness model that Performs better in our scenario. However we have to take into consideration that we are providing a dynamic solution which adds relevant features.	eng
dc.language.iso	eng	-
dc.rights	closedAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/	-
dc.subject	Anonimização Dinâmica	por
dc.subject	K-Anonymity	por
dc.subject	Privacidade Diferencial	por
dc.subject	MongoDB	por
dc.subject	ARX	por
dc.subject	Dynamic Anonymization	eng
dc.subject	K-Anonymity	eng
dc.subject	Differential Privacy	eng
dc.subject	MongoDB	eng
dc.subject	ARX	eng
dc.title	Query Anonymization for MongoDB	eng
dc.title.alternative	Anonimização Dinâmica para MongoDB	por
dc.type	masterThesis	-
degois.publication.location	DEI-FCTUC	-
degois.publication.title	Query Anonymization for MongoDB	eng
dc.peerreviewed	yes	-
dc.identifier.tid	202307050	-
thesis.degree.discipline	Informática	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado em Engenharia Informática	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Engenharia Informática	-
uc.degree.grantorID	0500	-
uc.contributor.author	Pires, Hélio Bento Renato::0000-0003-2688-3860	-
uc.degree.classification	16	-
uc.degree.presidentejuri	Arrais, Joel Perdiz	-
uc.degree.elementojuri	Cabral, Bruno Miguel Brás	-
uc.degree.elementojuri	Furtado, Pedro Nuno San-Bento	-
uc.contributor.advisor	Cabral, Bruno Miguel Brás	-
item.openairetype	masterThesis	-
item.fulltext	Com Texto completo	-
item.languageiso639-1	en	-
item.grantfulltext	reserved	-
item.cerifentitytype	Publications	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
crisitem.advisor.researchunit	CISUC - Centre for Informatics and Systems of the University of Coimbra	-
crisitem.advisor.parentresearchunit	Faculty of Sciences and Technology	-
crisitem.advisor.orcid	0000-0001-9699-1133	-
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format	Login
Tese.pdf		2.77 MB	Adobe PDF	Request a copy

Show simple item record

Page view(s)

216

checked on Jul 17, 2024

Download(s)

52

checked on Jul 17, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM