Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios

Detalhes bibliográficos
Autor(a) principal: Santos, Leonardo Alves
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/212919
Resumo: A predição de estrutura 3D de proteínas ainda permanece como um dos maiores desafios a ser superado pela Bioinformática Estrutural. O número de conformações 3D que uma dada sequência de aminoácidos pode assumir é praticamente infinita, classificando o problema como NP-Completo. Devido a sua alta complexidade, métodos exatos não são capazes de encontrar a solução ótima para tal problema em tempo de execução plausível. Portanto, meta-heurísticas são ótimas candidatas para resolução do problema de predição de estruturas, ainda que não sejam capazes de garantir que a melhor solução seja sempre alcançada. A utilização de informações biológicas durante o processo de otimização já foi constatada por autores na literatura como fatores que auxiliam na obtenção de soluções melhores. Por exemplo, o uso de preferências conformacionais de ângulos de torção sob estruturas secundárias específicas para geração de indivíduos que compõem a população inicial de meta-heurísticas populacionais. Assim como, a utilização de informação a cerca de acoplamento de pares de aminoácidos através de análises estatísticas inversas, as quais permitem inferir aproximação 3D de aminoácidos, os quais não precisam estar linearmente próximos na sequência de aminoácidos. Os resultados das últimas edições do The Critical Assessment of Protein Structure Prediction mostram que métodos que utilizam esta inferência de contato entre aminoácidos para predição de estrutura de proteínas tiveram um aumento de precisão de predição. O presente trabalho tem por objetivo propor uma metodologia baseada em conhecimento para geração de modelos estruturais com características estruturais próximas às estruturas experimentalmente determinadas, assim como utilizar estes modelos como integrantes da população inicial de algoritmos de otimização baseados em população. A geração de modelos utilizará dois limitantes, primeiro os ângulos de torção para cada aminoácido sob uma estrutura secundária específica, calculadas a partir do Protein Data Bank, e segundo, informações de contatos 3D entre aminoácidos preditos a partir de análises de alinhamentos múltiplos de sequência. Os resultados obtidos pela avaliação estrutural dos modelos gerados mostram que o método é capaz de gerar estruturas próximas às estruturas determinadas experimentalmente, enquanto que para o processo de otimização fica claro o aumento de precisão de predição ao utilizar candidatos iniciais de alta qualidade.
id URGS_4e8228dc85ad7282d5d0a57dfa40507d
oai_identifier_str oai:www.lume.ufrgs.br:10183/212919
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Santos, Leonardo AlvesDorn, MárcioBraun, Rodrigo Ligabue2020-08-14T03:40:36Z2019http://hdl.handle.net/10183/212919001110712A predição de estrutura 3D de proteínas ainda permanece como um dos maiores desafios a ser superado pela Bioinformática Estrutural. O número de conformações 3D que uma dada sequência de aminoácidos pode assumir é praticamente infinita, classificando o problema como NP-Completo. Devido a sua alta complexidade, métodos exatos não são capazes de encontrar a solução ótima para tal problema em tempo de execução plausível. Portanto, meta-heurísticas são ótimas candidatas para resolução do problema de predição de estruturas, ainda que não sejam capazes de garantir que a melhor solução seja sempre alcançada. A utilização de informações biológicas durante o processo de otimização já foi constatada por autores na literatura como fatores que auxiliam na obtenção de soluções melhores. Por exemplo, o uso de preferências conformacionais de ângulos de torção sob estruturas secundárias específicas para geração de indivíduos que compõem a população inicial de meta-heurísticas populacionais. Assim como, a utilização de informação a cerca de acoplamento de pares de aminoácidos através de análises estatísticas inversas, as quais permitem inferir aproximação 3D de aminoácidos, os quais não precisam estar linearmente próximos na sequência de aminoácidos. Os resultados das últimas edições do The Critical Assessment of Protein Structure Prediction mostram que métodos que utilizam esta inferência de contato entre aminoácidos para predição de estrutura de proteínas tiveram um aumento de precisão de predição. O presente trabalho tem por objetivo propor uma metodologia baseada em conhecimento para geração de modelos estruturais com características estruturais próximas às estruturas experimentalmente determinadas, assim como utilizar estes modelos como integrantes da população inicial de algoritmos de otimização baseados em população. A geração de modelos utilizará dois limitantes, primeiro os ângulos de torção para cada aminoácido sob uma estrutura secundária específica, calculadas a partir do Protein Data Bank, e segundo, informações de contatos 3D entre aminoácidos preditos a partir de análises de alinhamentos múltiplos de sequência. Os resultados obtidos pela avaliação estrutural dos modelos gerados mostram que o método é capaz de gerar estruturas próximas às estruturas determinadas experimentalmente, enquanto que para o processo de otimização fica claro o aumento de precisão de predição ao utilizar candidatos iniciais de alta qualidade.The prediction of the 3D structure of proteins is one of the milestones yet to be overcome in Structural Bioinformatics. The number of 3D viable structures a single amino acid sequence can assume is humongous, classifying the problem as an NP-Complete. Due to its high complexity, exact methods could not find the optimal solution in feasible process time to the PSP problem. Hence, metaheuristics are an interesting way to approach the problem and find good solutions to it, even though they do not guarantee the finding of the best solution in the search space. The usage of biological information throughout the optimization process has already been demonstrated in the literature as a valuable addition. For example, the usage of the conformational preference of amino acid torsion angles under specific secondary structures during the assembly of the initial candidate solutions for population-based metaheuristics. In addition to this, the usage of co-evoltuion between aminoacid pairs, inferred from inverse statistical analyses, which allow to infer the 3D proximity in protein structure of residues that are not necessarily close to each other in sequence length. The results from the last editions of The Critical Assessment of Protein Structure Prediction have shown an increase of accuracy for those methods using the contact prediction information in their methodology. The present work aims to propose a knowledge-based approach to generate structural models with structural features close to the experimentally determined structure, as well as the usage of these assembled models to compose the initial solutions of optimization algorithms. The generation of structural models takes in consideration two biological constraints, first the torsion angles conformations for each amino acid residue under a specific secondary structure, retrieved from the Protein Data Bank, and second, the 3D predicted contact information retrieved from multiple sequence alignments outputs. The results obtained from the structural evaluation shows that the proposed method is able to generate individuals much like the ones experimentally determined, as for the result of the optimization process shows it is clear that the generation of high-quality initial structural models play an important role on the results.application/pdfporAcoplamento de resíduosÂngulos diedraisBioinformática estruturalPredição de estrutura de proteínasAmino acid residues couplingDihedral anglesProtein structure predictionStructural BioinformaticsInclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídiosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulCentro de Biotecnologia do Estado do Rio Grande do SulPrograma de Pós-Graduação em Biologia Celular e MolecularPorto Alegre, BR-RS2019mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001110712.pdf.txt001110712.pdf.txtExtracted Texttext/plain297999http://www.lume.ufrgs.br/bitstream/10183/212919/2/001110712.pdf.txt4da35c5ec3e38034965244c7a8d07924MD52ORIGINAL001110712.pdfTexto completoapplication/pdf27390807http://www.lume.ufrgs.br/bitstream/10183/212919/1/001110712.pdffe67e4a32d6472e39c5566b1e0b60055MD5110183/2129192022-09-07 04:50:52.329261oai:www.lume.ufrgs.br:10183/212919Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-09-07T07:50:52Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
title Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
spellingShingle Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
Santos, Leonardo Alves
Acoplamento de resíduos
Ângulos diedrais
Bioinformática estrutural
Predição de estrutura de proteínas
Amino acid residues coupling
Dihedral angles
Protein structure prediction
Structural Bioinformatics
title_short Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
title_full Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
title_fullStr Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
title_full_unstemmed Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
title_sort Inclusão de contatos evolutivamente conservados em métodos para predição da estrutura 3D de polipeptídios
author Santos, Leonardo Alves
author_facet Santos, Leonardo Alves
author_role author
dc.contributor.author.fl_str_mv Santos, Leonardo Alves
dc.contributor.advisor1.fl_str_mv Dorn, Márcio
dc.contributor.advisor-co1.fl_str_mv Braun, Rodrigo Ligabue
contributor_str_mv Dorn, Márcio
Braun, Rodrigo Ligabue
dc.subject.por.fl_str_mv Acoplamento de resíduos
Ângulos diedrais
Bioinformática estrutural
Predição de estrutura de proteínas
topic Acoplamento de resíduos
Ângulos diedrais
Bioinformática estrutural
Predição de estrutura de proteínas
Amino acid residues coupling
Dihedral angles
Protein structure prediction
Structural Bioinformatics
dc.subject.eng.fl_str_mv Amino acid residues coupling
Dihedral angles
Protein structure prediction
Structural Bioinformatics
description A predição de estrutura 3D de proteínas ainda permanece como um dos maiores desafios a ser superado pela Bioinformática Estrutural. O número de conformações 3D que uma dada sequência de aminoácidos pode assumir é praticamente infinita, classificando o problema como NP-Completo. Devido a sua alta complexidade, métodos exatos não são capazes de encontrar a solução ótima para tal problema em tempo de execução plausível. Portanto, meta-heurísticas são ótimas candidatas para resolução do problema de predição de estruturas, ainda que não sejam capazes de garantir que a melhor solução seja sempre alcançada. A utilização de informações biológicas durante o processo de otimização já foi constatada por autores na literatura como fatores que auxiliam na obtenção de soluções melhores. Por exemplo, o uso de preferências conformacionais de ângulos de torção sob estruturas secundárias específicas para geração de indivíduos que compõem a população inicial de meta-heurísticas populacionais. Assim como, a utilização de informação a cerca de acoplamento de pares de aminoácidos através de análises estatísticas inversas, as quais permitem inferir aproximação 3D de aminoácidos, os quais não precisam estar linearmente próximos na sequência de aminoácidos. Os resultados das últimas edições do The Critical Assessment of Protein Structure Prediction mostram que métodos que utilizam esta inferência de contato entre aminoácidos para predição de estrutura de proteínas tiveram um aumento de precisão de predição. O presente trabalho tem por objetivo propor uma metodologia baseada em conhecimento para geração de modelos estruturais com características estruturais próximas às estruturas experimentalmente determinadas, assim como utilizar estes modelos como integrantes da população inicial de algoritmos de otimização baseados em população. A geração de modelos utilizará dois limitantes, primeiro os ângulos de torção para cada aminoácido sob uma estrutura secundária específica, calculadas a partir do Protein Data Bank, e segundo, informações de contatos 3D entre aminoácidos preditos a partir de análises de alinhamentos múltiplos de sequência. Os resultados obtidos pela avaliação estrutural dos modelos gerados mostram que o método é capaz de gerar estruturas próximas às estruturas determinadas experimentalmente, enquanto que para o processo de otimização fica claro o aumento de precisão de predição ao utilizar candidatos iniciais de alta qualidade.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-08-14T03:40:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/212919
dc.identifier.nrb.pt_BR.fl_str_mv 001110712
url http://hdl.handle.net/10183/212919
identifier_str_mv 001110712
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/212919/2/001110712.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/212919/1/001110712.pdf
bitstream.checksum.fl_str_mv 4da35c5ec3e38034965244c7a8d07924
fe67e4a32d6472e39c5566b1e0b60055
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309168739975168