Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/93918
DC FieldValueLanguage
dc.contributor.advisorArrais, Joel Perdiz-
dc.contributor.authorCunha, Adriana Monteiro e-
dc.date.accessioned2021-03-29T22:06:24Z-
dc.date.available2021-03-29T22:06:24Z-
dc.date.issued2020-11-23-
dc.date.submitted2021-03-29-
dc.identifier.urihttps://hdl.handle.net/10316/93918-
dc.descriptionTrabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia-
dc.description.abstractThe recent advances in transcriptome sequencing technologies lead to the increase of gene expression studies, with significant impact in the fields of cellular biology and medicine. Typically, the work developed based on this type of data resorts to feature reduction techniques to combat the problems risen by the curse of dimensionality and from data extraction (such as dropout events, noise, etc.), especially in projects involving classification tasks. This dissertation presents a novel dimensionality reduction model inspired by deep neural networks, the Supervised Autoencoder, which combines the architecture of traditional autoencoders with a SoftMax classification layer, so the latent space maximizes different classes’ separability. To account for the recurring dropout events in this type of datasets, a Dropout layer was implemented during training, improving the model’s robustness. The present study focuses particularly on two-dimensional reductions to ease the information’s visualisation. In addition to an analysis of the effect of label usage in the feature reduction process (prior to potential classification tasks), the possibility of inferring new similarity patterns between samples through the latent space was explored.The model was validated with three datasets, comparing its results with those of Principal Component Analysis and the equivalent simple autoencoder, as well as by analysing the heatmap of the complete gene expression clustered based on the engineered features. The results show the model is capable of meaningful representations of the original data that ease the classification task compared to the ones resultant of state-of-the-art techniques. However, it is not possible to draw new parallels between samples based on those features.eng
dc.description.abstractOs recentes avanços nas tecnologias de sequenciação do transcriptoma humano levaram ao aumento de estudos baseados em dados de expressão genética, com notável impacto nas áreas da biologia e medicina. Tipicamente, o trabalho desenvolvido com base neste tipo de informação recorre a técnicas de redução de features para combater os problemas que advêm da curse of dimensionality e associados à extração de dados de expressão (como eventos de dropout, ruído, etc.), sobretudo em projetos com tarefas de classificação.Nesta dissertação apresenta-se um modelo de redução de dimensionalidade inspirado em redes neuronais, o Autoencoder Supervisionado, que acopla a arquitetura tradicional de autoencoders com uma camada de classificação SoftMax, para que as representações no espaço latente maximizem a separabilidade entre diferentes classes. De forma a considerar os recorrentes eventos dropout neste tipo de dados, foi usada uma camada Dropout na fase de treino, conferindo maior robustez ao modelo. O estudo em causa foca-se em particular em reduções para duas dimensões, de forma a facilitar a visualização gráfica de informação. Além da análise do efeito da contabilização de classes no processo de redução de features (a priori de potenciais tarefas de classificação), explorou-se a possibilidade de o espaço latente obtido permitir aferir novos padrões de semelhança entre amostras.O modelo foi validado usando três conjuntos de dados, comparando os seus resultados com os obtidos através de Principal Component Analysis e do autoencoder simples equivalente, bem como através da análise do mapa de calor dos dados completos de expressão genética agrupados através do clustering hierárquico das features reduzidas.Os resultados mostram que o modelo é capaz de gerar representações adequadas dos dados originais, que permitem facilitar a tarefa de classificação quando comparadas com as resultantes das técnicas estado-da-arte. No entanto, não foi possível utilizá-las para estabelecer novos paralelos entre amostras.por
dc.description.sponsorshipOutro - Projeto financiado pela Fundação para a Ciência e Tecnologia: D4 - Deep Drug Discovery and Deployment (CENTRO-01-0145-FEDER-029266)-
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectRedução De Featurespor
dc.subjectExpressão Genéticapor
dc.subjectAutoencoderpor
dc.subjectAprendizagem Supervisionadapor
dc.subjectVisualização De Dadospor
dc.subjectFeature Reductioneng
dc.subjectGene Expression Profilingeng
dc.subjectAutoencodereng
dc.subjectSupervised Learningeng
dc.subjectData Visualisationeng
dc.titleNeural networks for 2D representations of cell expressioneng
dc.title.alternativeRedes neuronais para representações 2D de expressão genéticapor
dc.typemasterThesis-
degois.publication.locationCISUC-
degois.publication.titleNeural networks for 2D representations of cell expressioneng
dc.peerreviewedyes-
dc.identifier.tid202687520-
thesis.degree.disciplineEngenharia Biomédica-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado Integrado em Engenharia Biomédica-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Física-
uc.degree.grantorID0500-
uc.contributor.authorCunha, Adriana Monteiro e::0000-0001-6430-110X-
uc.degree.classification18-
uc.degree.presidentejuriPires, Paula Cristina Veríssimo-
uc.degree.elementojuriCorreia, Fernanda Brito-
uc.degree.elementojuriArrais, Joel Perdiz-
uc.contributor.advisorArrais, Joel Perdiz-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.openairetypemasterThesis-
item.cerifentitytypePublications-
item.grantfulltextopen-
item.fulltextCom Texto completo-
item.languageiso639-1en-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.orcid0000-0003-4937-2334-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
tese final.pdf2.24 MBAdobe PDFView/Open
Show simple item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons