Computational methodologies for predicting protein-protein Interactions

Detalhes bibliográficos
Autor(a) principal: Castanheira, João Miguel Pereira Rebordão
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/86177
Resumo: Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia
id RCAP_6c3b725c7a731a7d61b9bda8d718586f
oai_identifier_str oai:estudogeral.uc.pt:10316/86177
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Computational methodologies for predicting protein-protein InteractionsMetodologias computacionais para previsão de interações proteína-proteinaInteração proteína-proteínaMelhorar performanceExtração de featuresMódulos de reconhecimento peptídicoPyDPIProtein-protein interactionPerformance improvementFeatures extractionPeptide recognition modulesPyDPIDissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e TecnologiaDevido à relevância das interações proteicas nas diferentes funções celulares, é importante conseguir detetar a existência das mesmas. Como os métodos computacionais conseguem lidar com um grande número de dados de forma rápida, têm sido muito usados na previsão das interações proteína-proteína. Dessa forma esta tese pretende, com o recurso a novas features, desenvolver um método que melhore a performance da previsão de interações proteicas num dataset aleatório. O resultado destas pesquisas foram três novas abordagens de extração de features sendo elas o recurso a bases de dados de inibidores, o recurso a redes de co-expressão génica e o recurso a módulos de reconhecimento peptídico. Destas três, devido à maior simplicidade e praticabilidade, desenvolveu-se estudos usando a última abordagem enunciada, recorrendo nomeadamente aos domínios SH3, SH2, PDZ, WW e LRR. Para saber se estes domínios são uma boa fonte de features e que podem ser usados utilizando qualquer dataset, analisaram-se os mesmos na deteção de novas interações entre proteínas que não os possuem. Assim no decorrer do trabalho desta tese foram criadas três estratégias, a primeira baseava-se na extração de features pelo software PyDPI (fazendo uso dos descriptors AAC, CTD, Moranauto, QSO, SOCN e CT) e na avaliação da performance dos datasets por descriptor; a segunda estratégia recorreu às mesmas features mas avaliou a performance em datasets com todos os descriptors; a terceira estratégia avaliou a performance como a segunda estratégia mas usando features criadas para o artigo “A Sequence-Based Mesh Classifier for the Prediction of Protein-Protein Interactions". As duas primeiras estratégias foram postas de parte devido a metodologia incorreta e a valores pouco significativos. A terceira estratégia apesar de ter sido efetuada de uma forma bastante controlada também resultou em valores pouco significativos, pelos que se aconselha ao prosseguimento do estudo desta abordagem com novas estratégias e features.Due to the relevance of protein interactions in different cellular functions, it is important to be able to detect their existence. Because computational methods can handle large numbers of data quickly, they have been widely used in predicting protein-protein interactions. Thus, this thesis intends, with the use of new features, to develop a method that improves the predictive performance of protein interactions in a random dataset. The results of these researches were three new approaches of extraction of features, being: the use of databases of inhibitors, the use of gene co-expression networks and the use of peptide recognition modules. Of these three, due to the greater simplicity and practicality, studies were developed using the last approach enunciated, resorting in particular to the SH3, SH2, PDZ, WW and LRR domains. In order to know if these domains are a good source of features and that can be used using any dataset, they were analyzed in the detection of new interactions between proteins that do not possess them. Thus, in the course of the work of this thesis three strategies were created, the first one was based on the extraction of features by the software PyDPI (making use of descriptors AAC, CTD, Moranauto, QSO, SOCN and CT) and in the performance evaluation of datasets by descriptor ; the second strategy resorted to the same features but evaluated the performance in datasets with all descriptors; the third strategy evaluated performance as the second strategy but using features created for the article "The Sequence-Based Mesh Classifier for the Prediction of Protein-Protein Interactions." The first two strategies were set aside due to incorrect methodology and poor values. The third strategy, despite being carried out in a very controlled manner, also resulted in insignificant values, for which it is advisable to continue the study of this approach with new strategies and features.2018-09-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/86177http://hdl.handle.net/10316/86177TID:202205525engCastanheira, João Miguel Pereira Rebordãoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T01:45:04Zoai:estudogeral.uc.pt:10316/86177Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:07:23.298931Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Computational methodologies for predicting protein-protein Interactions
Metodologias computacionais para previsão de interações proteína-proteina
title Computational methodologies for predicting protein-protein Interactions
spellingShingle Computational methodologies for predicting protein-protein Interactions
Castanheira, João Miguel Pereira Rebordão
Interação proteína-proteína
Melhorar performance
Extração de features
Módulos de reconhecimento peptídico
PyDPI
Protein-protein interaction
Performance improvement
Features extraction
Peptide recognition modules
PyDPI
title_short Computational methodologies for predicting protein-protein Interactions
title_full Computational methodologies for predicting protein-protein Interactions
title_fullStr Computational methodologies for predicting protein-protein Interactions
title_full_unstemmed Computational methodologies for predicting protein-protein Interactions
title_sort Computational methodologies for predicting protein-protein Interactions
author Castanheira, João Miguel Pereira Rebordão
author_facet Castanheira, João Miguel Pereira Rebordão
author_role author
dc.contributor.author.fl_str_mv Castanheira, João Miguel Pereira Rebordão
dc.subject.por.fl_str_mv Interação proteína-proteína
Melhorar performance
Extração de features
Módulos de reconhecimento peptídico
PyDPI
Protein-protein interaction
Performance improvement
Features extraction
Peptide recognition modules
PyDPI
topic Interação proteína-proteína
Melhorar performance
Extração de features
Módulos de reconhecimento peptídico
PyDPI
Protein-protein interaction
Performance improvement
Features extraction
Peptide recognition modules
PyDPI
description Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia
publishDate 2018
dc.date.none.fl_str_mv 2018-09-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/86177
http://hdl.handle.net/10316/86177
TID:202205525
url http://hdl.handle.net/10316/86177
identifier_str_mv TID:202205525
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133965365280768