Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/110354
Campo DCValorIdioma
dc.contributor.advisorArrais, Joel Perdiz-
dc.contributor.authorCarlos, Elmer Jorge Inácio-
dc.date.accessioned2023-11-20T23:06:58Z-
dc.date.available2023-11-20T23:06:58Z-
dc.date.issued2023-09-29-
dc.date.submitted2023-11-20-
dc.identifier.urihttps://hdl.handle.net/10316/110354-
dc.descriptionDissertação de Mestrado em Biologia Computacional apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractA geração de genótipos é uma tarefa importante na pesquisa genética, oferecendo oportunidades para aumento de dados e preservação da privacidade em Estudos de associação do genoma completo (GWAS). Neste trabalho, propusemos um framework de Rede Generativa Adversaria de Wasserstein com Penalidade de Gradiente (WGAN-GP) para sintetizar dados de genótipos realistas. Nossa abordagem consistiu em duas etapas separadas: um processo de pré-treino auto-supervisionado e o processo de treinamento do WGAN-GP. Ao longo do processo de pré-treino, o gerador atua como um modelo semelhante a um decodificador, mapeando as estatísticas genéticas de baixa dimensão para os genótipos originais. Esse processo serve como uma forte inicialização para o subsequente processo de treinamento do WGAN-GP, onde o objetivo é fazer o gerador aprender a sintetizar genótipos diversos e realistas. Os resultados de nosso framework proposto, auxiliado pelas informações codificadas nas estatísticas genéticas de resumo, demonstram resultados favoráveis, destacando valores promissores de estatísticas genéticas e utilidade dos dados sintéticos. No entanto, as diversas discrepâncias observadas nos gráficos de Análise de Componentes Principais (PCA) e a divergência na validação apontam para várias áreas de melhoria futura. Planeamos melhorar ainda mais a eficácia e aplicabilidade da geração de genótipos sintéticos do modelo, explorando a geração multimodal e o melhoramento do desempenho do pré-treinamento. Com essa abordagem baseada em aprendizagem profunda, expandimos os limites da geração de genótipos sintéticos e impulsionamos o progresso da pesquisa genética.por
dc.description.abstractGenotype generation is an useful complement for genetic research, which offers opportunities for data augmentation and privacy preservation of Genome-Wide Association Studies (GWAS). With this study, we proposed a Wasserstein Generative Adversarial Network with Gradient Penalty (WGAN-GP) framework for synthesizing realistic genotype data. Our approach consisted of two separate steps: a self-supervised pretraining process and the WGAN-GP training process. Throughout the pretraining process the generator acts like a decoder-like model, mapping the lower dimensional summary statistics to the original genotype data. This process serves as a strong initialization for the subsequent WGAN-GP training process, where the goal is to make the generator learn to synthetize diverse and realistic genotypes. The results of our proposed framework aided with the information encoded in the summary statistics file demonstrate favourable outcomes, highlighting promising genetic statistics values and utility of the synthetic data. Nevertheless, the various discrepancies observed with the principal component analysis (PCA) plots and divergence in validation hints towards multiple future areas of improvement. We aim to further advance the model's synthetics genome generation efficacy and applicability, by exploring multi-modal generation and fine-tuning pretraining. With this Deep learning based approach, we push the boundaries of synthetic genotype generation and foster the progress of genetic research.eng
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectAprendizagem profundapor
dc.subjectModelos Generativospor
dc.subjectRedes Generativas Adversariaspor
dc.subjectEstudo de associação do genoma completopor
dc.subjectCoorte caso-controlopor
dc.subjectDeep Learningeng
dc.subjectGenerative Modelseng
dc.subjectGenerative Adversarial Networkseng
dc.subjectGenome-wide Association Studieseng
dc.subjectCase-Control Cohortseng
dc.titleGenerative models for synthesis of artificial human genomes using GWAS summary statisticseng
dc.title.alternativeGenerative models for synthesis of artificial human genomes using GWAS summary statisticspor
dc.typemasterThesis-
degois.publication.locationUniversidade de Coimbra-
degois.publication.titleGenerative models for synthesis of artificial human genomes using GWAS summary statisticseng
dc.peerreviewedyes-
dc.identifier.tid203392760-
thesis.degree.disciplineBiologia-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Biologia Computacional-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Ciências da Vida-
uc.degree.grantorID0500-
uc.contributor.authorCarlos, Elmer Jorge Inácio::0009-0009-4151-0596-
uc.degree.classification16-
uc.degree.presidentejuriMoreira, Irina de Sousa-
uc.degree.elementojuriArrais, Joel Perdiz-
uc.degree.elementojuriMatos, Sérgio Guilherme Aleixo de-
uc.contributor.advisorArrais, Joel Perdiz-
item.openairetypemasterThesis-
item.fulltextCom Texto completo-
item.languageiso639-1en-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Aparece nas coleções:UC - Dissertações de Mestrado
Ficheiros deste registo:
Ficheiro TamanhoFormato
2023_Thesis_MSc_Elmer.pdf3.95 MBAdobe PDFVer/Abrir
Mostrar registo em formato simples

Visualizações de página

82
Visto em 17/jul/2024

Google ScholarTM

Verificar


Este registo está protegido por Licença Creative Commons Creative Commons