Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/114500
DC FieldValueLanguage
dc.contributor.advisorMachado, Fernando Jorge Penousal Martins-
dc.contributor.advisorArrais, Joel Perdiz-
dc.contributor.authorCruz, António Malta Lopes da-
dc.date.accessioned2024-03-28T23:00:35Z-
dc.date.available2024-03-28T23:00:35Z-
dc.date.issued2023-06-21-
dc.date.submitted2024-03-28-
dc.identifier.urihttps://hdl.handle.net/10316/114500-
dc.descriptionTese de Programa de Doutoramento em Ciências e Tecnologias da Informação apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractA visualização de dados têm sido mostrada como uma ferramenta importante na descoberta de conhecimento, sendo utilizada ao lado da análise de dados para identificar e realçar padrões, tendências e outliers, ajudando os utilizadores na toma de decisões. A necessidade de analisar datasets sem estruturas explicitas e cada vez com maiores volumes tem levado à emergência contínua de ferramentas de visualização que procuram providenciar métodos que facilitam a exploração e análise destes datasets. Muitos campos de estudo ainda enfrentam os desafios inerentes à análise de datasets multidimensionais complexos, como o campo de biologia computacional, cuja pesquisa de doenças infeciosas tem de lidar com redes complexas de interação de proteínas que contém milhares de genes com valores de expressão que variam com o tempo. No decorrer desta tese, exploramos a visualização de dados multivariados através do CroP, uma ferramenta de visualização de dados com uma framework de múltiplas vistas coordenadas que permite a adaptação do ambiente de trabalho a diferentes problemas através de painéis flexíveis. Enquanto que o CroP é capaz de processar datasets relacionais, temporais e multivariados genéricos, também apresenta métodos direcionados à análise de dados biológicos. Estes dados podem ser representados através de vários layouts dinâmicos e funcionalidades que não só realçam relacionamentos entre variáveis diferentes, mas também aprofundam a procura em padrões descobertos de modo a melhor compreender as suas causas e efeitos. Em particular, podemos realçar a exploração de séries temporais através das nossas implementações dinâmicas e parametrizáveis de layouts que deformam linhas do tempo para representarem visualmente os comportamentos temporais de datasets. A validade dos modelos e métodos implementados é demonstrada através de experiências com datasets multivariados diversos, com um foco em datasets de expressão temporal de genes, complementado com uma discussão sobre como estes contribuíram para a criação de visualizações compreensíveis, como facilitaram a análise de dados, e como promovem a descoberta de padrões. Adicionalmente, validamos o CroP através de testes de modelo e interface realizados com participantes dos campos de visualização de informação e de biologia computacional. Na apresentação da nossa pesquisa e discussão dos seus resultados, podemos realçar as seguintes contribuições: uma análise dos modelos e ferramentas de visualização disponíveis para datasets multivariados, bem como métodos de análise de dados modernos que podem ser utilizados cooperativamente para explorar estes datasets; uma framework de múltiplas vistas coordenadas com um ambiente de trabalho modular que pode ser adaptado à análise de uma variedade de problemas; modelos de visualização dinâmicos que exploram a representação de datasets multivariados complexos, combinados com métodos de análise de dados modernos para realçar e analisar eventos e padrões significativos, uma ferramenta de visualização que incorpora a framework desenvolvida, os modelos de visualização e métodos de análise de dados em uma plataforma que pode ser utilizada por diferentes tipos de utilizador.por
dc.description.abstractData visualization has been shown to be an important tool in knowledge discovery, being used alongside data analysis to identify and highlight patterns, trends and outliers, aiding users in decision-making. The need for analyzing unstructured and increasingly larger datasets has led to the continued emergence of visualization tools that seek to provide methods that facilitate the exploration and analysis of such datasets. Many fields of study still face the challenges inherent to the analysis of complex multidimensional datasets, such as the field of computational biology, whose research of infectious diseases must contend with large protein-protein interaction networks with thousands of genes that vary in expression values over time. Throughout this thesis, we explore the visualization of multivariate data through CroP, a data visualization tool with a coordinated multiple views framework that allows users to adapt the workspace to different problems through flexible panels. While CroP is able to process generic relational, temporal and multivariate quantitative data, it also presents methods directed at the analysis of biological data. This data can be represented through various layouts and functionalities that not only highlight relationships between different variables, but also dig-down into discovered patterns in order to better understand their sources and their effects. In particular, we can highlight the exploration of time-series through our dynamic and parameter-based implementation of layouts that bend timelines to visually represent how datasets behave over time. The implemented models and methods are demonstrated through experiments with diverse multivariate datasets, with a focus on gene expression time-series datasets, and complemented with a discussion on how these contributed to the creation of comprehensible visualizations, facilitated data analysis, and promoted pattern discovery. We also validate CroP through model and interface tests performed with participants from both the fields of information visualization and computational biology. As we present our research and a discussion of its results, we can highlight the following contributions: an analysis of the available range of visualization models and tools for multivariate datasets, as well as modern data analysis methods that can be used cooperatively to explore such datasets; a coordinated multiple views framework with a modular workspace that can be adapted to the analysis of varied problems; dynamic visualization models that explore the representation of complex multivariate datasets, combined with modern data analysis methods to highlight and analyze significant events and patterns; a visualization tool that incorporates the developed framework, visualization models and data analysis methods into a platform that can be used by different types of users.eng
dc.description.sponsorshipFCT-
dc.description.sponsorshipFCT-
dc.language.isoeng-
dc.relationinfo:eu-repo/grantAgreement/FCT/POR_CENTRO/COVID/BD/152131/2021/PT-
dc.relationinfo:eu-repo/grantAgreement/FCT/POR_CENTRO/SFRH/BD/124538/2016/PT-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/-
dc.subjectBiologia Computacionalpor
dc.subjectFerramenta de Visualizaçãopor
dc.subjectSéries Temporaispor
dc.subjectVisualização Científicapor
dc.subjectVisualização de Informaçãopor
dc.subjectComputational Biologyeng
dc.subjectInformation Visualizationeng
dc.subjectScientific Visualizationeng
dc.subjectTime-Serieseng
dc.subjectVisualization Tooleng
dc.titleCoordinated Visualization Panels for Biological Datasetseng
dc.title.alternativePainéis de Visualização Coordenados para Datasets Biológicospor
dc.typedoctoralThesis-
degois.publication.locationFCTUC-DEI-
degois.publication.titleCoordinated Visualization Panels for Biological Datasetseng
dc.peerreviewedyes-
dc.identifier.tid101718691-
dc.subject.fosCiências exactas e naturais::Ciências da computação e Ciência da informação-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.namePrograma de Doutoramento em Ciências e Tecnologias da Informação-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorCruz, António Malta Lopes da::0000-0001-9812-5781-
uc.degree.classificationAprovado com Distinção-
uc.degree.presidentejuriHenriques, Jorge Manuel Oliveira-
uc.degree.elementojuriMiksch, Sílvia-
uc.degree.elementojuriReboiro-Jato, Miguel-
uc.degree.elementojuriGonçalves, Daniel Jorge Viegas-
uc.degree.elementojuriMachado, Fernando Jorge Penousal Martins-
uc.degree.elementojuriTeixeira, César Alexandre Domingues::0000-0001-9396-1211-
uc.contributor.advisorMachado, Fernando Jorge Penousal Martins-
uc.contributor.advisorArrais, Joel Perdiz-
item.openairetypedoctoralThesis-
item.fulltextCom Texto completo-
item.languageiso639-1en-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Appears in Collections:UC - Teses de Doutoramento
Files in This Item:
File SizeFormat
AntonioCruz-TesePhD.pdf26.71 MBAdobe PDFView/Open
Show simple item record

Page view(s)

21
checked on Jul 17, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons