Computational methodologies for predicting protein-protein Interactions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/86177 |
Resumo: | Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_6c3b725c7a731a7d61b9bda8d718586f |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/86177 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Computational methodologies for predicting protein-protein InteractionsMetodologias computacionais para previsão de interações proteína-proteinaInteração proteína-proteínaMelhorar performanceExtração de featuresMódulos de reconhecimento peptídicoPyDPIProtein-protein interactionPerformance improvementFeatures extractionPeptide recognition modulesPyDPIDissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e TecnologiaDevido à relevância das interações proteicas nas diferentes funções celulares, é importante conseguir detetar a existência das mesmas. Como os métodos computacionais conseguem lidar com um grande número de dados de forma rápida, têm sido muito usados na previsão das interações proteína-proteína. Dessa forma esta tese pretende, com o recurso a novas features, desenvolver um método que melhore a performance da previsão de interações proteicas num dataset aleatório. O resultado destas pesquisas foram três novas abordagens de extração de features sendo elas o recurso a bases de dados de inibidores, o recurso a redes de co-expressão génica e o recurso a módulos de reconhecimento peptídico. Destas três, devido à maior simplicidade e praticabilidade, desenvolveu-se estudos usando a última abordagem enunciada, recorrendo nomeadamente aos domínios SH3, SH2, PDZ, WW e LRR. Para saber se estes domínios são uma boa fonte de features e que podem ser usados utilizando qualquer dataset, analisaram-se os mesmos na deteção de novas interações entre proteínas que não os possuem. Assim no decorrer do trabalho desta tese foram criadas três estratégias, a primeira baseava-se na extração de features pelo software PyDPI (fazendo uso dos descriptors AAC, CTD, Moranauto, QSO, SOCN e CT) e na avaliação da performance dos datasets por descriptor; a segunda estratégia recorreu às mesmas features mas avaliou a performance em datasets com todos os descriptors; a terceira estratégia avaliou a performance como a segunda estratégia mas usando features criadas para o artigo “A Sequence-Based Mesh Classifier for the Prediction of Protein-Protein Interactions". As duas primeiras estratégias foram postas de parte devido a metodologia incorreta e a valores pouco significativos. A terceira estratégia apesar de ter sido efetuada de uma forma bastante controlada também resultou em valores pouco significativos, pelos que se aconselha ao prosseguimento do estudo desta abordagem com novas estratégias e features.Due to the relevance of protein interactions in different cellular functions, it is important to be able to detect their existence. Because computational methods can handle large numbers of data quickly, they have been widely used in predicting protein-protein interactions. Thus, this thesis intends, with the use of new features, to develop a method that improves the predictive performance of protein interactions in a random dataset. The results of these researches were three new approaches of extraction of features, being: the use of databases of inhibitors, the use of gene co-expression networks and the use of peptide recognition modules. Of these three, due to the greater simplicity and practicality, studies were developed using the last approach enunciated, resorting in particular to the SH3, SH2, PDZ, WW and LRR domains. In order to know if these domains are a good source of features and that can be used using any dataset, they were analyzed in the detection of new interactions between proteins that do not possess them. Thus, in the course of the work of this thesis three strategies were created, the first one was based on the extraction of features by the software PyDPI (making use of descriptors AAC, CTD, Moranauto, QSO, SOCN and CT) and in the performance evaluation of datasets by descriptor ; the second strategy resorted to the same features but evaluated the performance in datasets with all descriptors; the third strategy evaluated performance as the second strategy but using features created for the article "The Sequence-Based Mesh Classifier for the Prediction of Protein-Protein Interactions." The first two strategies were set aside due to incorrect methodology and poor values. The third strategy, despite being carried out in a very controlled manner, also resulted in insignificant values, for which it is advisable to continue the study of this approach with new strategies and features.2018-09-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/86177http://hdl.handle.net/10316/86177TID:202205525engCastanheira, João Miguel Pereira Rebordãoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T01:45:04Zoai:estudogeral.uc.pt:10316/86177Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:07:23.298931Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Computational methodologies for predicting protein-protein Interactions Metodologias computacionais para previsão de interações proteína-proteina |
title |
Computational methodologies for predicting protein-protein Interactions |
spellingShingle |
Computational methodologies for predicting protein-protein Interactions Castanheira, João Miguel Pereira Rebordão Interação proteína-proteína Melhorar performance Extração de features Módulos de reconhecimento peptídico PyDPI Protein-protein interaction Performance improvement Features extraction Peptide recognition modules PyDPI |
title_short |
Computational methodologies for predicting protein-protein Interactions |
title_full |
Computational methodologies for predicting protein-protein Interactions |
title_fullStr |
Computational methodologies for predicting protein-protein Interactions |
title_full_unstemmed |
Computational methodologies for predicting protein-protein Interactions |
title_sort |
Computational methodologies for predicting protein-protein Interactions |
author |
Castanheira, João Miguel Pereira Rebordão |
author_facet |
Castanheira, João Miguel Pereira Rebordão |
author_role |
author |
dc.contributor.author.fl_str_mv |
Castanheira, João Miguel Pereira Rebordão |
dc.subject.por.fl_str_mv |
Interação proteína-proteína Melhorar performance Extração de features Módulos de reconhecimento peptídico PyDPI Protein-protein interaction Performance improvement Features extraction Peptide recognition modules PyDPI |
topic |
Interação proteína-proteína Melhorar performance Extração de features Módulos de reconhecimento peptídico PyDPI Protein-protein interaction Performance improvement Features extraction Peptide recognition modules PyDPI |
description |
Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-09-26 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/86177 http://hdl.handle.net/10316/86177 TID:202205525 |
url |
http://hdl.handle.net/10316/86177 |
identifier_str_mv |
TID:202205525 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133965365280768 |