Computational methods for the understanding of protein-based interactions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/82909 |
Resumo: | Dissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_51a113a2b8e6568e0d1eb5344607f15c |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/82909 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Computational methods for the understanding of protein-based interactionsMétodos computacionais para compreender interações proteína-proteínainterfaces proteína-proteínamachine-learningbioinformáticabiologia estruturalprotein-protein interfacesmachine-learningbioinformaticsstructural biologyDissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e TecnologiaCompreender as interfaces proteína-proteína é a base do estudo das interações molecular em organismos e na determinação da sua relevância em redes proteicas complexas. Contudo, a informação mais detalhada sobre complexos proteicos – estruturas tridimensionais – é muitas vezes inexistente, principalmente devido a dificuldades na sua determinação experimental. Como tal, métodos computacionais surgem como cada vez mais válidos e capazes de atingir o mesmo desempenho demonstrado por métodos experimentais ao utilizarem a informação disponível de experiências anteriores como um fator chave no estudo da estrutura proteica. Como tal, esta tese focou-se nas interfaces proteína-proteína e na maneira como ferramentas computacionais podem ser utilizadas para ajudar na sua compreensão. Para atingir isto, quatro tarefas foram realizadas. A primeira consistiu no desenvolvimento de um método computacional para prever resíduos importantes em interfaces proteína-proteína (Hot-spots (HS)) através de uma combinação de algoritmos de machine-learning. O modelo final, SpotOn, tem uma precisão de 0.95 e uma sensibilidade de 0.98 para um conjunto de dados independente e está disponível em http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. A segunda tarefa envolveu uma aferição global de interfaces proteína-proteína e HS com uma base de dados não redundante de complexos proteicos e uma versão adaptada do método computacional desenvolvido na tarefa anterior. Características estruturais, o número de resíduos próximos intermonoméricos e de HS próximos foram determinantes na caracterização de HS. A terceira tarefa consistiu no desenvolvimento de um algoritmo capaz de prever resíduos interfaciais a partir de informação estrutural de monómeros com ferramentas de deep-learning. O modelo final foi incapaz de prever resíduos interfaciais, provavelmente devido à ausência de características relevantes para o problema. A quarta tarefa pretendia perceber como é que a dinâmica proteica afeta as interfaces proteína-proteína usando análise de modos normais (AMN) e distâncias inter-hélice num caso de estudo baseado na ligação de recetores acoplados a proteínas-G (RAPG) a parceiros intracelulares. Enquanto que valores de flutuação de RAPGs obtidos através da AMN eram capazes de distinguir diferentes proteínas-G e diferentes arrestinas, não eram úteis na distinção entre proteínas-G e arrestinas. Nas distâncias inter-hélice acontecia o oposto – as proteínas-G era facilmente distinguidas das arrestinas, mas diferentes proteínas-G e diferentes arrestinas eram indistinguíveis. Os resultados da segunda e terceira estão disponíveis online em 45.32.153.74/spotondb e 45.32.153.74/gpcr, respetivamente.Understanding protein-protein interfaces is at the foundation of studying molecular interactions in living organisms and in determining their relevance in high-order protein networks. However, the most detailed information on protein complexes – the three-dimensional structure – is often unavailable, mainly due to difficulties in their experimental determination. As such, computational methods rise as increasingly valid alternatives by using the information already retrieved from previous experiments as a driving key factor of protein structure study. This thesis work focuses on protein-protein interfaces and how computational tools can be used to aid in their understanding. As such, four main tasks were conducted. The first was the development of a computational pipeline for the prediction of important residues in protein-protein interfaces (Hot-spots (HS)) using an ensemble of machine-learning algorithms. The final model, SpotOn, had an Accuracy of 0.95 and a Sensitivity of 0.98 for an independent test set and is available online in http://milou.science.uu.nl/cgi/services/SPOTON/spoton/. The second task involved a global assessment of protein-protein interfaces and HS using a non-redundant database of protein complexes and an adapted version of the computational pipeline developed in the previous task. By doing so, structural features, the number of intermonomer neighbouring residues and neighbouring HS came out as essential in defining HS. The third task was the development of an algorithm capable of predicting interfacial residues from monomer structure information using deep-learning. The final model was not able to predict interfacial residues, probably due to the absence of relevant features. The fourth and final task aimed at understanding how dynamics affect protein-protein interfaces using normal mode analysis (NMA) and interhelical distance in a case study based on G-protein coupled receptor (GPCR)-partner binding. While GPCR fluctuation values from NMA were able to distinguish different G-proteins and different arrestins, they were not as useful in distinguishing G-proteins from arrestins. Interhelical distance did the opposite – G-proteins were easily distinguished from arrestins, but different G-proteins and different arrestins were undistinguishable. Results from the second and fourth tasks are available online in 45.32.153.74/spotondb and 45.32.153.74/gpcr, respectively.2017-09-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/82909http://hdl.handle.net/10316/82909TID:202123910engAlmeida, José Guilherme Coelho Peres deinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2019-06-02T14:32:07Zoai:estudogeral.uc.pt:10316/82909Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:04:45.619930Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Computational methods for the understanding of protein-based interactions Métodos computacionais para compreender interações proteína-proteína |
title |
Computational methods for the understanding of protein-based interactions |
spellingShingle |
Computational methods for the understanding of protein-based interactions Almeida, José Guilherme Coelho Peres de interfaces proteína-proteína machine-learning bioinformática biologia estrutural protein-protein interfaces machine-learning bioinformatics structural biology |
title_short |
Computational methods for the understanding of protein-based interactions |
title_full |
Computational methods for the understanding of protein-based interactions |
title_fullStr |
Computational methods for the understanding of protein-based interactions |
title_full_unstemmed |
Computational methods for the understanding of protein-based interactions |
title_sort |
Computational methods for the understanding of protein-based interactions |
author |
Almeida, José Guilherme Coelho Peres de |
author_facet |
Almeida, José Guilherme Coelho Peres de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Almeida, José Guilherme Coelho Peres de |
dc.subject.por.fl_str_mv |
interfaces proteína-proteína machine-learning bioinformática biologia estrutural protein-protein interfaces machine-learning bioinformatics structural biology |
topic |
interfaces proteína-proteína machine-learning bioinformática biologia estrutural protein-protein interfaces machine-learning bioinformatics structural biology |
description |
Dissertação de Mestrado em Biologia Celular e Molecular apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-09-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/82909 http://hdl.handle.net/10316/82909 TID:202123910 |
url |
http://hdl.handle.net/10316/82909 |
identifier_str_mv |
TID:202123910 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133939275661312 |