Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87838
Title: Strategies of autoencoders in the prediction of protein-protein interactions
Other Titles: Estratégias de Autoencoders na Previsão de Interações entre Proteínas
Authors: Antunes, João Miguel Loureiro Albuquerque
Orientador: Pereira, Carlos Manuel Jorge da Silva
Arrais, Joel Perdiz
Keywords: Autoencoders; Bioinformática; Desenvolvimento de Fármacos; Interação Proteína-Proteína; Auotencoders; Bioinformatics; Drug Development; Protein-Protein Interaction
Issue Date: 27-Sep-2019
Serial title, monograph or event: Strategies of autoencoders in the prediction of protein-protein interactions
Place of publication or event: CISUC/DEI
Abstract: A compreensão do corpo humano tem sido uma luta desde que a humanidade desenvolveu um sentido crítico à vida. As proteínas são um elemento chave no normal funcionamento do nosso organismo e intervém na maioria dos processos biológicos que existem em todos os seres vivos. A sua associação, designada Interação Proteína-Proteína, pode regular a sua expressão, mas também aumentar o seu número de funções, bem como maximizar ou reduzir o seu impacto.Estas interações são de incalculável valor quando considerado o fator benéfico que podem ter para a crua de doenças e prevenção das mesmas.No contexto da Descoberta e Implementação de Fármacos, o custo e tempo de síntese de uma nova molécula viável, que sobreviva aos ensaios clínicos e à aprovação das agências reguladoras, afirma-se como um dos problemas centrais para a indústria farmacêutica que se tem voltado para a Bioinformática como uma alternativa mais rápida e barata.A pesquisa realizada nesta tese pretende ser a base de contexto no qual os Alvos Terapêuticos se devem desenvolver para alcançar esta redução de custos. A abordagem aplica Algoritmos de Deep Learning, especificamente Autoencoders e Máquinas de Vetores de Suporte, a conjuntos de dados de interações conhecidas e é capaz de reconhecer novos pares de proteínas que interagem num mesmo organismo ou no contexto interespécies. Apesar dos métodos não serem novos, esta abordagem introduz o conceito de uso de erros no encoding dos Autoencoders como dimensões para classificação das entradas como pares de proteínas que interagem ou não interagem.Os resultados preliminares mostram um elevado AUC na previsão, alcançando 0.970 para o organismo humano, mas com alguns desvios não justificados quando considerada a relação filogenética que precisam de ser analisados em trabalho futuro dentro da mesma espécie e em contexto interespécie.
The understanding of the human body has always been a struggle since humanity has developed a critical sense to life. Proteins are a key element in the normal functioning of our organism and intervene in most of the biological processes that exist in all living beings. Their association, designated Protein-Protein Interactions, can regulate their expression but also increase the number of functions, as well as maximizing or reducing their impact.These interactions are of invaluable worth when considering the benefic factor they can have in the healing of diseases and their prevention. In the context of Drug Discovery and Deployment, the cost and time of synthesizing a new viable molecule, which survives clinical trials and regulatory agencies approval, stand as the core problems for the pharmaceutical industry which has turned the focus to Bioinformatics as a possible cost and time saving alternative.The research made in this thesis intends to be the base of context to which the Drug Targeting must be developed to reach this goal of cost reduction. The approach applies Deep Learning Algorithms, specifically Autoencoders and Support Vector Machines, to datasets of known interactions and is able to discover new protein pairs that interact within the same organism or interspecies.While the methods are not new, this approach introduces a concept of the use of the errors in the prediction of the Autoencoders as features to classify the inputs as Interacting or Non-Interacting pairs of proteins.The preliminary results show high AUC in the prediction reaching 0.970 for the human organism, but with some unjustified deviations considering the phylogenetic relationships that need to be analyzed in future work both within the same species and interspecies trials.
Description: Dissertação de Mestrado Integrado em Engenharia Biomédica apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/87838
Rights: embargoedAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Tese final João Miguel Antunes.pdf2.28 MBAdobe PDFView/Open
Show full item record

Page view(s)

148
checked on May 7, 2024

Download(s)

67
checked on May 7, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons