Computational methods for the understanding of protein-based interactions

Detalhes bibliográficos
Autor(a) principal: Almeida, José Guilherme Coelho Peres de
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/82909
Resumo: Dissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e Tecnologia
id RCAP_51a113a2b8e6568e0d1eb5344607f15c
oai_identifier_str oai:estudogeral.uc.pt:10316/82909
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Computational methods for the understanding of protein-based interactionsMétodos computacionais para compreender interações proteína-proteínainterfaces proteína-proteínamachine-learningbioinformáticabiologia estruturalprotein-protein interfacesmachine-learningbioinformaticsstructural biologyDissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e TecnologiaCompreender as interfaces proteína-proteína é a base do estudo das interações molecular em organismos e na determinação da sua relevância em redes proteicas complexas. Contudo, a informação mais detalhada sobre complexos proteicos – estruturas tridimensionais – é muitas vezes inexistente, principalmente devido a dificuldades na sua determinação experimental. Como tal, métodos computacionais surgem como cada vez mais válidos e capazes de atingir o mesmo desempenho demonstrado por métodos experimentais ao utilizarem a informação disponível de experiências anteriores como um fator chave no estudo da estrutura proteica. Como tal, esta tese focou-se nas interfaces proteína-proteína e na maneira como ferramentas computacionais podem ser utilizadas para ajudar na sua compreensão. Para atingir isto, quatro tarefas foram realizadas. A primeira consistiu no desenvolvimento de um método computacional para prever resíduos importantes em interfaces proteína-proteína (Hot-spots (HS)) através de uma combinação de algoritmos de machine-learning. O modelo final, SpotOn, tem uma precisão de 0.95 e uma sensibilidade de 0.98 para um conjunto de dados independente e está disponível em http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. A segunda tarefa envolveu uma aferição global de interfaces proteína-proteína e HS com uma base de dados não redundante de complexos proteicos e uma versão adaptada do método computacional desenvolvido na tarefa anterior. Características estruturais, o número de resíduos próximos intermonoméricos e de HS próximos foram determinantes na caracterização de HS. A terceira tarefa consistiu no desenvolvimento de um algoritmo capaz de prever resíduos interfaciais a partir de informação estrutural de monómeros com ferramentas de deep-learning. O modelo final foi incapaz de prever resíduos interfaciais, provavelmente devido à ausência de características relevantes para o problema. A quarta tarefa pretendia perceber como é que a dinâmica proteica afeta as interfaces proteína-proteína usando análise de modos normais (AMN) e distâncias inter-hélice num caso de estudo baseado na ligação de recetores acoplados a proteínas-G (RAPG) a parceiros intracelulares. Enquanto que valores de flutuação de RAPGs obtidos através da AMN eram capazes de distinguir diferentes proteínas-G e diferentes arrestinas, não eram úteis na distinção entre proteínas-G e arrestinas. Nas distâncias inter-hélice acontecia o oposto – as proteínas-G era facilmente distinguidas das arrestinas, mas diferentes proteínas-G e diferentes arrestinas eram indistinguíveis. Os resultados da segunda e terceira estão disponíveis online em 45.32.153.74/spotondb e 45.32.153.74/gpcr, respetivamente.Understanding protein-protein interfaces is at the foundation of studying molecular interactions in living organisms and in determining their relevance in high-order protein networks. However, the most detailed information on protein complexes – the three-dimensional structure – is often unavailable, mainly due to difficulties in their experimental determination. As such, computational methods rise as increasingly valid alternatives by using the information already retrieved from previous experiments as a driving key factor of protein structure study. This thesis work focuses on protein-protein interfaces and how computational tools can be used to aid in their understanding. As such, four main tasks were conducted. The first was the development of a computational pipeline for the prediction of important residues in protein-protein interfaces (Hot-spots (HS)) using an ensemble of machine-learning algorithms. The final model, SpotOn, had an Accuracy of 0.95 and a Sensitivity of 0.98 for an independent test set and is available online in http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. The second task involved a global assessment of protein-protein interfaces and HS using a non-redundant database of protein complexes and an adapted version of the computational pipeline developed in the previous task. By doing so, structural features, the number of intermonomer neighbouring residues and neighbouring HS came out as essential in defining HS. The third task was the development of an algorithm capable of predicting interfacial residues from monomer structure information using deep-learning. The final model was not able to predict interfacial residues, probably due to the absence of relevant features. The fourth and final task aimed at understanding how dynamics affect protein-protein interfaces using normal mode analysis (NMA) and interhelical distance in a case study based on G-protein coupled receptor (GPCR)-partner binding. While GPCR fluctuation values from NMA were able to distinguish different G-proteins and different arrestins, they were not as useful in distinguishing G-proteins from arrestins. Interhelical distance did the opposite – G-proteins were easily distinguished from arrestins, but different G-proteins and different arrestins were undistinguishable. Results from the second and fourth tasks are available online in 45.32.153.74/spotondb and 45.32.153.74/gpcr, respectively.2017-09-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/82909http://hdl.handle.net/10316/82909TID:202123910engAlmeida, José Guilherme Coelho Peres deinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2019-06-02T14:32:07Zoai:estudogeral.uc.pt:10316/82909Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:04:45.619930Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Computational methods for the understanding of protein-based interactions
Métodos computacionais para compreender interações proteína-proteína
title Computational methods for the understanding of protein-based interactions
spellingShingle Computational methods for the understanding of protein-based interactions
Almeida, José Guilherme Coelho Peres de
interfaces proteína-proteína
machine-learning
bioinformática
biologia estrutural
protein-protein interfaces
machine-learning
bioinformatics
structural biology
title_short Computational methods for the understanding of protein-based interactions
title_full Computational methods for the understanding of protein-based interactions
title_fullStr Computational methods for the understanding of protein-based interactions
title_full_unstemmed Computational methods for the understanding of protein-based interactions
title_sort Computational methods for the understanding of protein-based interactions
author Almeida, José Guilherme Coelho Peres de
author_facet Almeida, José Guilherme Coelho Peres de
author_role author
dc.contributor.author.fl_str_mv Almeida, José Guilherme Coelho Peres de
dc.subject.por.fl_str_mv interfaces proteína-proteína
machine-learning
bioinformática
biologia estrutural
protein-protein interfaces
machine-learning
bioinformatics
structural biology
topic interfaces proteína-proteína
machine-learning
bioinformática
biologia estrutural
protein-protein interfaces
machine-learning
bioinformatics
structural biology
description Dissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e Tecnologia
publishDate 2017
dc.date.none.fl_str_mv 2017-09-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/82909
http://hdl.handle.net/10316/82909
TID:202123910
url http://hdl.handle.net/10316/82909
identifier_str_mv TID:202123910
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133939275661312