Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87943
DC FieldValueLanguage
dc.contributor.advisorCabral, Bruno Miguel Brás-
dc.contributor.authorPires, Hélio Bento Renato-
dc.date.accessioned2019-11-18T23:26:23Z-
dc.date.available2019-11-18T23:26:23Z-
dc.date.issued2019-09-11-
dc.date.submitted2019-11-18-
dc.identifier.urihttps://hdl.handle.net/10316/87943-
dc.descriptionDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractExiste cada vez mais recolha de dados para análise. Grande parte dos dados contém informações pessoais. Soluções de anonimização são essenciais para que a privacidade possa ser garantida aquando a publicação de dados. Isto aumenta a procura de soluções de anonimização dinâmicas, pois precisamos de sistemas que conseguem operar sem constante necessidade de supervisão humana.Critérios de anonimização como privacidade diferencial são assegurados por algoritmos e oferecem garantias mensuráveis de anonimização. Utilizamos implementações desses algoritmos providos através da API do ARX para o desenvolvimento duma ferramenta de anonimização dinâmica. Pretendemos atingir a anonimização de dados mantendo os tempos de respostas o mais rápido possível.Esta ferramenta foi utilizada para investigar a viabilidade dessa abordagem para anonimização de \textit{queries}. Foi utilizado para caracterizar anonimização de queries. Executamos varias \textit{queries} com vários algoritmos de anonimização recolhendo os dados sobre esse processo para posterior análise exploratória de dados. O principal objetivo é o estudo do \textit{trade-off} entre privacidade e utilidade dos dados no contexto das \textit{queries}. Esses dados também são utilizados para validar nosso sistema.A principal vantagem de anonimização de queries segundo nossa abordagem é a precisão das queries. Pois elas são feitas a uma base de dados não anonimizada. Esta solução pode responder a queries em tempos aceitáveis se essas não tiverem uma dimensão elevada ou se o algoritmo usado para privacidade diferencial. Da perspetiva de utilidade de dados a anonimização estática é ligeiramente mais eficiente entretanto para o algoritmo t-closeness a nossa solução teve melhor desempenho. Temos que levar em consideração que a nossa solução acrescenta mais funcionalidades extras.por
dc.description.abstractData is being collected and analyzed at an unprecedented scale. A big part of the data being analyzed contains personal information. Anonymization solutions are essential, so privacy can be protected when publishing personal data. This increases pressure for the development of dynamic anonymization systems as we need systems that can operate without constant human supervision. Anonymization standards like differential Privacy can be provided by algorithms and offer measurable guarantees of privacy. We used the algorithms provided by to develop a dynamic anonymization system. We intend to achieve data anonymization keeping response time as fast as possible.Our solution was used to investigate the viability of this approach to query anonymization and study its characteristics. We execute multiple queries with different anonymization algorithms while collecting data for subsequent exploratory data analysis. The main goal was to study how the trade-off between privacy and data utility behaves under query constraints. Also, with this information perform the validation of our system. Our approach to query anonymization has the advantage of query precision as we are querying before anonymizing. This solution can respond to queries in responsive time if the queries are not too large. From a data utility standpoint anonymizing the whole database is slightly better except for the t-closeness model that Performs better in our scenario. However we have to take into consideration that we are providing a dynamic solution which adds relevant features.eng
dc.language.isoeng-
dc.rightsclosedAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/-
dc.subjectAnonimização Dinâmicapor
dc.subjectK-Anonymitypor
dc.subjectPrivacidade Diferencialpor
dc.subjectMongoDBpor
dc.subjectARXpor
dc.subjectDynamic Anonymizationeng
dc.subjectK-Anonymityeng
dc.subjectDifferential Privacyeng
dc.subjectMongoDBeng
dc.subjectARXeng
dc.titleQuery Anonymization for MongoDBeng
dc.title.alternativeAnonimização Dinâmica para MongoDBpor
dc.typemasterThesis-
degois.publication.locationDEI-FCTUC-
degois.publication.titleQuery Anonymization for MongoDBeng
dc.peerreviewedyes-
dc.identifier.tid202307050-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Informática-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorPires, Hélio Bento Renato::0000-0003-2688-3860-
uc.degree.classification16-
uc.degree.presidentejuriArrais, Joel Perdiz-
uc.degree.elementojuriCabral, Bruno Miguel Brás-
uc.degree.elementojuriFurtado, Pedro Nuno San-Bento-
uc.contributor.advisorCabral, Bruno Miguel Brás-
item.openairetypemasterThesis-
item.fulltextCom Texto completo-
item.languageiso639-1en-
item.grantfulltextreserved-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.orcid0000-0001-9699-1133-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat Login
Tese.pdf2.77 MBAdobe PDF    Request a copy
Show simple item record

Page view(s)

216
checked on Jul 17, 2024

Download(s)

52
checked on Jul 17, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons