Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87943
Title: Query Anonymization for MongoDB
Other Titles: Anonimização Dinâmica para MongoDB
Authors: Pires, Hélio Bento Renato
Orientador: Cabral, Bruno Miguel Brás
Keywords: Anonimização Dinâmica; K-Anonymity; Privacidade Diferencial; MongoDB; ARX; Dynamic Anonymization; K-Anonymity; Differential Privacy; MongoDB; ARX
Issue Date: 11-Sep-2019
Serial title, monograph or event: Query Anonymization for MongoDB
Place of publication or event: DEI-FCTUC
Abstract: Existe cada vez mais recolha de dados para análise. Grande parte dos dados contém informações pessoais. Soluções de anonimização são essenciais para que a privacidade possa ser garantida aquando a publicação de dados. Isto aumenta a procura de soluções de anonimização dinâmicas, pois precisamos de sistemas que conseguem operar sem constante necessidade de supervisão humana.Critérios de anonimização como privacidade diferencial são assegurados por algoritmos e oferecem garantias mensuráveis de anonimização. Utilizamos implementações desses algoritmos providos através da API do ARX para o desenvolvimento duma ferramenta de anonimização dinâmica. Pretendemos atingir a anonimização de dados mantendo os tempos de respostas o mais rápido possível.Esta ferramenta foi utilizada para investigar a viabilidade dessa abordagem para anonimização de \textit{queries}. Foi utilizado para caracterizar anonimização de queries. Executamos varias \textit{queries} com vários algoritmos de anonimização recolhendo os dados sobre esse processo para posterior análise exploratória de dados. O principal objetivo é o estudo do \textit{trade-off} entre privacidade e utilidade dos dados no contexto das \textit{queries}. Esses dados também são utilizados para validar nosso sistema.A principal vantagem de anonimização de queries segundo nossa abordagem é a precisão das queries. Pois elas são feitas a uma base de dados não anonimizada. Esta solução pode responder a queries em tempos aceitáveis se essas não tiverem uma dimensão elevada ou se o algoritmo usado para privacidade diferencial. Da perspetiva de utilidade de dados a anonimização estática é ligeiramente mais eficiente entretanto para o algoritmo t-closeness a nossa solução teve melhor desempenho. Temos que levar em consideração que a nossa solução acrescenta mais funcionalidades extras.
Data is being collected and analyzed at an unprecedented scale. A big part of the data being analyzed contains personal information. Anonymization solutions are essential, so privacy can be protected when publishing personal data. This increases pressure for the development of dynamic anonymization systems as we need systems that can operate without constant human supervision. Anonymization standards like differential Privacy can be provided by algorithms and offer measurable guarantees of privacy. We used the algorithms provided by to develop a dynamic anonymization system. We intend to achieve data anonymization keeping response time as fast as possible.Our solution was used to investigate the viability of this approach to query anonymization and study its characteristics. We execute multiple queries with different anonymization algorithms while collecting data for subsequent exploratory data analysis. The main goal was to study how the trade-off between privacy and data utility behaves under query constraints. Also, with this information perform the validation of our system. Our approach to query anonymization has the advantage of query precision as we are querying before anonymizing. This solution can respond to queries in responsive time if the queries are not too large. From a data utility standpoint anonymizing the whole database is slightly better except for the t-closeness model that Performs better in our scenario. However we have to take into consideration that we are providing a dynamic solution which adds relevant features.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/87943
Rights: closedAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat Login
Tese.pdf2.77 MBAdobe PDF    Request a copy
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons