Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/82909
Title: Computational methods for the understanding of protein-based interactions
Other Titles: Métodos computacionais para compreender interações proteína-proteína
Authors: Almeida, José Guilherme Coelho Peres de 
Orientador: Carvalho, Ana Luísa Monteiro de
Moreira, Irina de Sousa
Keywords: interfaces proteína-proteína; machine-learning; bioinformática; biologia estrutural; protein-protein interfaces; machine-learning; bioinformatics; structural biology
Issue Date: 15-Sep-2017
Serial title, monograph or event: Computational methods for the understanding of protein-based interactions
Place of publication or event: Grupo "Structural, Computational and Chemical Biology", Centro de Neurociências e Biologia Celular, Universidade de Coimbra
Abstract: Compreender as interfaces proteína-proteína é a base do estudo das interações molecular em organismos e na determinação da sua relevância em redes proteicas complexas. Contudo, a informação mais detalhada sobre complexos proteicos – estruturas tridimensionais – é muitas vezes inexistente, principalmente devido a dificuldades na sua determinação experimental. Como tal, métodos computacionais surgem como cada vez mais válidos e capazes de atingir o mesmo desempenho demonstrado por métodos experimentais ao utilizarem a informação disponível de experiências anteriores como um fator chave no estudo da estrutura proteica. Como tal, esta tese focou-se nas interfaces proteína-proteína e na maneira como ferramentas computacionais podem ser utilizadas para ajudar na sua compreensão. Para atingir isto, quatro tarefas foram realizadas. A primeira consistiu no desenvolvimento de um método computacional para prever resíduos importantes em interfaces proteína-proteína (Hot-spots (HS)) através de uma combinação de algoritmos de machine-learning. O modelo final, SpotOn, tem uma precisão de 0.95 e uma sensibilidade de 0.98 para um conjunto de dados independente e está disponível em http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. A segunda tarefa envolveu uma aferição global de interfaces proteína-proteína e HS com uma base de dados não redundante de complexos proteicos e uma versão adaptada do método computacional desenvolvido na tarefa anterior. Características estruturais, o número de resíduos próximos intermonoméricos e de HS próximos foram determinantes na caracterização de HS. A terceira tarefa consistiu no desenvolvimento de um algoritmo capaz de prever resíduos interfaciais a partir de informação estrutural de monómeros com ferramentas de deep-learning. O modelo final foi incapaz de prever resíduos interfaciais, provavelmente devido à ausência de características relevantes para o problema. A quarta tarefa pretendia perceber como é que a dinâmica proteica afeta as interfaces proteína-proteína usando análise de modos normais (AMN) e distâncias inter-hélice num caso de estudo baseado na ligação de recetores acoplados a proteínas-G (RAPG) a parceiros intracelulares. Enquanto que valores de flutuação de RAPGs obtidos através da AMN eram capazes de distinguir diferentes proteínas-G e diferentes arrestinas, não eram úteis na distinção entre proteínas-G e arrestinas. Nas distâncias inter-hélice acontecia o oposto – as proteínas-G era facilmente distinguidas das arrestinas, mas diferentes proteínas-G e diferentes arrestinas eram indistinguíveis. Os resultados da segunda e terceira estão disponíveis online em 45.32.153.74/spotondb e 45.32.153.74/gpcr, respetivamente.
Understanding protein-protein interfaces is at the foundation of studying molecular interactions in living organisms and in determining their relevance in high-order protein networks. However, the most detailed information on protein complexes – the three-dimensional structure – is often unavailable, mainly due to difficulties in their experimental determination. As such, computational methods rise as increasingly valid alternatives by using the information already retrieved from previous experiments as a driving key factor of protein structure study. This thesis work focuses on protein-protein interfaces and how computational tools can be used to aid in their understanding. As such, four main tasks were conducted. The first was the development of a computational pipeline for the prediction of important residues in protein-protein interfaces (Hot-spots (HS)) using an ensemble of machine-learning algorithms. The final model, SpotOn, had an Accuracy of 0.95 and a Sensitivity of 0.98 for an independent test set and is available online in http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. The second task involved a global assessment of protein-protein interfaces and HS using a non-redundant database of protein complexes and an adapted version of the computational pipeline developed in the previous task. By doing so, structural features, the number of intermonomer neighbouring residues and neighbouring HS came out as essential in defining HS. The third task was the development of an algorithm capable of predicting interfacial residues from monomer structure information using deep-learning. The final model was not able to predict interfacial residues, probably due to the absence of relevant features. The fourth and final task aimed at understanding how dynamics affect protein-protein interfaces using normal mode analysis (NMA) and interhelical distance in a case study based on G-protein coupled receptor (GPCR)-partner binding. While GPCR fluctuation values from NMA were able to distinguish different G-proteins and different arrestins, they were not as useful in distinguishing G-proteins from arrestins. Interhelical distance did the opposite – G-proteins were easily distinguished from arrestins, but different G-proteins and different arrestins were undistinguishable. Results from the second and fourth tasks are available online in 45.32.153.74/spotondb and 45.32.153.74/gpcr, respectively.
Description: Dissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/82909
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
MERGE.pdf3.95 MBAdobe PDFView/Open
Show full item record

Page view(s) 50

558
checked on Apr 23, 2024

Download(s) 50

675
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons