Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/114500
Título: Coordinated Visualization Panels for Biological Datasets
Outros títulos: Painéis de Visualização Coordenados para Datasets Biológicos
Autor: Cruz, António Malta Lopes da
Orientador: Machado, Fernando Jorge Penousal Martins
Arrais, Joel Perdiz
Palavras-chave: Biologia Computacional; Ferramenta de Visualização; Séries Temporais; Visualização Científica; Visualização de Informação; Computational Biology; Information Visualization; Scientific Visualization; Time-Series; Visualization Tool
Data: 21-Jun-2023
Projeto: info:eu-repo/grantAgreement/FCT/POR_CENTRO/COVID/BD/152131/2021/PT 
info:eu-repo/grantAgreement/FCT/POR_CENTRO/SFRH/BD/124538/2016/PT 
Título da revista, periódico, livro ou evento: Coordinated Visualization Panels for Biological Datasets
Local de edição ou do evento: FCTUC-DEI
Resumo: A visualização de dados têm sido mostrada como uma ferramenta importante na descoberta de conhecimento, sendo utilizada ao lado da análise de dados para identificar e realçar padrões, tendências e outliers, ajudando os utilizadores na toma de decisões. A necessidade de analisar datasets sem estruturas explicitas e cada vez com maiores volumes tem levado à emergência contínua de ferramentas de visualização que procuram providenciar métodos que facilitam a exploração e análise destes datasets. Muitos campos de estudo ainda enfrentam os desafios inerentes à análise de datasets multidimensionais complexos, como o campo de biologia computacional, cuja pesquisa de doenças infeciosas tem de lidar com redes complexas de interação de proteínas que contém milhares de genes com valores de expressão que variam com o tempo. No decorrer desta tese, exploramos a visualização de dados multivariados através do CroP, uma ferramenta de visualização de dados com uma framework de múltiplas vistas coordenadas que permite a adaptação do ambiente de trabalho a diferentes problemas através de painéis flexíveis. Enquanto que o CroP é capaz de processar datasets relacionais, temporais e multivariados genéricos, também apresenta métodos direcionados à análise de dados biológicos. Estes dados podem ser representados através de vários layouts dinâmicos e funcionalidades que não só realçam relacionamentos entre variáveis diferentes, mas também aprofundam a procura em padrões descobertos de modo a melhor compreender as suas causas e efeitos. Em particular, podemos realçar a exploração de séries temporais através das nossas implementações dinâmicas e parametrizáveis de layouts que deformam linhas do tempo para representarem visualmente os comportamentos temporais de datasets. A validade dos modelos e métodos implementados é demonstrada através de experiências com datasets multivariados diversos, com um foco em datasets de expressão temporal de genes, complementado com uma discussão sobre como estes contribuíram para a criação de visualizações compreensíveis, como facilitaram a análise de dados, e como promovem a descoberta de padrões. Adicionalmente, validamos o CroP através de testes de modelo e interface realizados com participantes dos campos de visualização de informação e de biologia computacional. Na apresentação da nossa pesquisa e discussão dos seus resultados, podemos realçar as seguintes contribuições: uma análise dos modelos e ferramentas de visualização disponíveis para datasets multivariados, bem como métodos de análise de dados modernos que podem ser utilizados cooperativamente para explorar estes datasets; uma framework de múltiplas vistas coordenadas com um ambiente de trabalho modular que pode ser adaptado à análise de uma variedade de problemas; modelos de visualização dinâmicos que exploram a representação de datasets multivariados complexos, combinados com métodos de análise de dados modernos para realçar e analisar eventos e padrões significativos, uma ferramenta de visualização que incorpora a framework desenvolvida, os modelos de visualização e métodos de análise de dados em uma plataforma que pode ser utilizada por diferentes tipos de utilizador.
Data visualization has been shown to be an important tool in knowledge discovery, being used alongside data analysis to identify and highlight patterns, trends and outliers, aiding users in decision-making. The need for analyzing unstructured and increasingly larger datasets has led to the continued emergence of visualization tools that seek to provide methods that facilitate the exploration and analysis of such datasets. Many fields of study still face the challenges inherent to the analysis of complex multidimensional datasets, such as the field of computational biology, whose research of infectious diseases must contend with large protein-protein interaction networks with thousands of genes that vary in expression values over time. Throughout this thesis, we explore the visualization of multivariate data through CroP, a data visualization tool with a coordinated multiple views framework that allows users to adapt the workspace to different problems through flexible panels. While CroP is able to process generic relational, temporal and multivariate quantitative data, it also presents methods directed at the analysis of biological data. This data can be represented through various layouts and functionalities that not only highlight relationships between different variables, but also dig-down into discovered patterns in order to better understand their sources and their effects. In particular, we can highlight the exploration of time-series through our dynamic and parameter-based implementation of layouts that bend timelines to visually represent how datasets behave over time. The implemented models and methods are demonstrated through experiments with diverse multivariate datasets, with a focus on gene expression time-series datasets, and complemented with a discussion on how these contributed to the creation of comprehensible visualizations, facilitated data analysis, and promoted pattern discovery. We also validate CroP through model and interface tests performed with participants from both the fields of information visualization and computational biology. As we present our research and a discussion of its results, we can highlight the following contributions: an analysis of the available range of visualization models and tools for multivariate datasets, as well as modern data analysis methods that can be used cooperatively to explore such datasets; a coordinated multiple views framework with a modular workspace that can be adapted to the analysis of varied problems; dynamic visualization models that explore the representation of complex multivariate datasets, combined with modern data analysis methods to highlight and analyze significant events and patterns; a visualization tool that incorporates the developed framework, visualization models and data analysis methods into a platform that can be used by different types of users.
Descrição: Tese de Programa de Doutoramento em Ciências e Tecnologias da Informação apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/114500
Direitos: openAccess
Aparece nas coleções:UC - Teses de Doutoramento

Ficheiros deste registo:
Ficheiro TamanhoFormato
AntonioCruz-TesePhD.pdf26.71 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

21
Visto em 17/jul/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons