Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas

Detalhes bibliográficos
Autor(a) principal: Oliveira, Mariana dos Santos
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/179716
Resumo: O conhecimento da estrutura tridimensional de proteínas permite a inferência e estudo de sua função. Predizer essa estrutura 3D a partir da sequência linear de aminoácidos é um dos problemas mais difíceis da Bioinformática Estrutural. Fragmentos de loops da cadeia polipeptídica são ditos estruturas flexíveis e de alta variabilidade sendo consideradas mais difíceis de serem preditas e manipuladas. Devido à alta seletividade do processo de enovelamento proteico, o espaço de busca tridimensional é extenso, podendo ser manipulado como um problema de otimização. Assim, este trabalho tem como proposta a criação de uma Biblioteca de Padrões Estruturais (BPE) para regiões de loops, criada a partir de dados experimentais extraídos do Protein Data Bank (PDB) a fim de diminuir o espaço de busca conformacional. Esta biblioteca foi empregada com conhecimento na metaheurística Self-Adapting Differential Evolution (SADE) aplicada ao problema de predição de estruturas 3D de proteínas. Para validação da BPE foram implementadas duas versões do algoritmo SADE, em que a primeira utilizava os dados da BPE e APL-1 como conhecimento para geração e evolução da população e a segunda utilizava apenas a APL- 1, considerando a não existência dos padrões estruturais. Para análise dos resultados foi considerada a função de aptidão e calculados os valores de RMSD e GDT_TS para as estruturas preditas em relaçao as estruturas experimentais. Os valores de RMSD médio mostraram-se 93% melhores para as execuções utilizando a BPE, além disso, 92% das estruturas com menor valor de RMSD foram geradas utilizando a BPE. Os valores de GDT_TS médio revelaram-se 93% melhores em estruturas preditas com a utilização da BPE, além disso, 61,5% das estruturas geradas com a utilização da BPE apresentaram os maiores valores de GDT_TS. Os valores da função de energia não indicaram diferenças entre as diferentes variações do método SADE. Em suma, a partir dos resultados apresentados é possível afirmar que a utilização da BPE como conhecimento na metaheurística SADE é capaz de gerar estruturas 3D de proteínas mais próximas às estruturas experimentais do que quando comparado à implementação do mesmo método sem a utilização da BPE.
id UFRGS-2_2f9884ab59a4ece9e461598195ddfc30
oai_identifier_str oai:www.lume.ufrgs.br:10183/179716
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Oliveira, Mariana dos SantosDorn, Márcio2018-06-26T02:30:57Z2016http://hdl.handle.net/10183/179716001027193O conhecimento da estrutura tridimensional de proteínas permite a inferência e estudo de sua função. Predizer essa estrutura 3D a partir da sequência linear de aminoácidos é um dos problemas mais difíceis da Bioinformática Estrutural. Fragmentos de loops da cadeia polipeptídica são ditos estruturas flexíveis e de alta variabilidade sendo consideradas mais difíceis de serem preditas e manipuladas. Devido à alta seletividade do processo de enovelamento proteico, o espaço de busca tridimensional é extenso, podendo ser manipulado como um problema de otimização. Assim, este trabalho tem como proposta a criação de uma Biblioteca de Padrões Estruturais (BPE) para regiões de loops, criada a partir de dados experimentais extraídos do Protein Data Bank (PDB) a fim de diminuir o espaço de busca conformacional. Esta biblioteca foi empregada com conhecimento na metaheurística Self-Adapting Differential Evolution (SADE) aplicada ao problema de predição de estruturas 3D de proteínas. Para validação da BPE foram implementadas duas versões do algoritmo SADE, em que a primeira utilizava os dados da BPE e APL-1 como conhecimento para geração e evolução da população e a segunda utilizava apenas a APL- 1, considerando a não existência dos padrões estruturais. Para análise dos resultados foi considerada a função de aptidão e calculados os valores de RMSD e GDT_TS para as estruturas preditas em relaçao as estruturas experimentais. Os valores de RMSD médio mostraram-se 93% melhores para as execuções utilizando a BPE, além disso, 92% das estruturas com menor valor de RMSD foram geradas utilizando a BPE. Os valores de GDT_TS médio revelaram-se 93% melhores em estruturas preditas com a utilização da BPE, além disso, 61,5% das estruturas geradas com a utilização da BPE apresentaram os maiores valores de GDT_TS. Os valores da função de energia não indicaram diferenças entre as diferentes variações do método SADE. Em suma, a partir dos resultados apresentados é possível afirmar que a utilização da BPE como conhecimento na metaheurística SADE é capaz de gerar estruturas 3D de proteínas mais próximas às estruturas experimentais do que quando comparado à implementação do mesmo método sem a utilização da BPE.The knowledge of three-dimensional (3D) protein structure allows the determination and study of biological function. One of the most difficult problems in Structural Bioinformatics is the prediction of 3D protein structure from amino acids sequence. Loops fragments are flexible and highly variable structures in the polypeptide chain, so loops are more difficult to predict. Due to the high selectivity of protein folding process, the 3D search space is extensive. Therefore, this work proposes a loop Structure Pattern Library (BPE) which was created using experimental information extracted from Protein Data Bank (PDB) aiming to constrain the conformational search space. Self-Adapting Differential Evolution (SADE) metaheuristic was implemented for the 3D protein structure prediction problem using BPE as knowledge. SADE algorithm was tested in two versions. First, BPE and APL-1 were used as information to population generation and evolution. Second, only APL-1 was employ. Average RMSD results were better in 93% of cases using BPE, besides 92% of structures with minimum RMSD were predicted using BPE. Average GDT_TS were higher in 93% of cases using BPE and maximum GDT_TS were higher in 61,5% of BPE cases. Fitness function did not show different results between SADE versions. Thereby, our results allows us to state that BPE application as knowledge in SADE metaheuristic is capable to create 3D protein structures closer to experimental structures than SADE application without BPE.application/pdfporBioinformática estruturalPrediçãoMicrobial transglutaminaseBacillus megateriumStructural bioinformaticsLoops regionsKnowledgeb based search methodsMetaheuristics3D Protein structure predictionIdentificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínasIdentification of conformational patterns in experimental structures and metaheuristic applied to 3D protein structural prediction info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de BiociênciasPorto Alegre, BR-RS2016Biotecnologiagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001027193.pdf001027193.pdfTexto completoapplication/pdf9457709http://www.lume.ufrgs.br/bitstream/10183/179716/1/001027193.pdf24c153eb0bb3fb7f118b9c10a6c3f820MD51TEXT001027193.pdf.txt001027193.pdf.txtExtracted Texttext/plain158232http://www.lume.ufrgs.br/bitstream/10183/179716/2/001027193.pdf.txtd259b5578c02b5cf04b9bbfda0f7c2d5MD5210183/1797162021-08-18 04:47:46.121985oai:www.lume.ufrgs.br:10183/179716Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-08-18T07:47:46Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
dc.title.alternative.en.fl_str_mv Identification of conformational patterns in experimental structures and metaheuristic applied to 3D protein structural prediction
title Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
spellingShingle Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
Oliveira, Mariana dos Santos
Bioinformática estrutural
Predição
Microbial transglutaminase
Bacillus megaterium
Structural bioinformatics
Loops regions
Knowledgeb based search methods
Metaheuristics
3D Protein structure prediction
title_short Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
title_full Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
title_fullStr Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
title_full_unstemmed Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
title_sort Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas
author Oliveira, Mariana dos Santos
author_facet Oliveira, Mariana dos Santos
author_role author
dc.contributor.author.fl_str_mv Oliveira, Mariana dos Santos
dc.contributor.advisor1.fl_str_mv Dorn, Márcio
contributor_str_mv Dorn, Márcio
dc.subject.por.fl_str_mv Bioinformática estrutural
Predição
topic Bioinformática estrutural
Predição
Microbial transglutaminase
Bacillus megaterium
Structural bioinformatics
Loops regions
Knowledgeb based search methods
Metaheuristics
3D Protein structure prediction
dc.subject.eng.fl_str_mv Microbial transglutaminase
Bacillus megaterium
Structural bioinformatics
Loops regions
Knowledgeb based search methods
Metaheuristics
3D Protein structure prediction
description O conhecimento da estrutura tridimensional de proteínas permite a inferência e estudo de sua função. Predizer essa estrutura 3D a partir da sequência linear de aminoácidos é um dos problemas mais difíceis da Bioinformática Estrutural. Fragmentos de loops da cadeia polipeptídica são ditos estruturas flexíveis e de alta variabilidade sendo consideradas mais difíceis de serem preditas e manipuladas. Devido à alta seletividade do processo de enovelamento proteico, o espaço de busca tridimensional é extenso, podendo ser manipulado como um problema de otimização. Assim, este trabalho tem como proposta a criação de uma Biblioteca de Padrões Estruturais (BPE) para regiões de loops, criada a partir de dados experimentais extraídos do Protein Data Bank (PDB) a fim de diminuir o espaço de busca conformacional. Esta biblioteca foi empregada com conhecimento na metaheurística Self-Adapting Differential Evolution (SADE) aplicada ao problema de predição de estruturas 3D de proteínas. Para validação da BPE foram implementadas duas versões do algoritmo SADE, em que a primeira utilizava os dados da BPE e APL-1 como conhecimento para geração e evolução da população e a segunda utilizava apenas a APL- 1, considerando a não existência dos padrões estruturais. Para análise dos resultados foi considerada a função de aptidão e calculados os valores de RMSD e GDT_TS para as estruturas preditas em relaçao as estruturas experimentais. Os valores de RMSD médio mostraram-se 93% melhores para as execuções utilizando a BPE, além disso, 92% das estruturas com menor valor de RMSD foram geradas utilizando a BPE. Os valores de GDT_TS médio revelaram-se 93% melhores em estruturas preditas com a utilização da BPE, além disso, 61,5% das estruturas geradas com a utilização da BPE apresentaram os maiores valores de GDT_TS. Os valores da função de energia não indicaram diferenças entre as diferentes variações do método SADE. Em suma, a partir dos resultados apresentados é possível afirmar que a utilização da BPE como conhecimento na metaheurística SADE é capaz de gerar estruturas 3D de proteínas mais próximas às estruturas experimentais do que quando comparado à implementação do mesmo método sem a utilização da BPE.
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2018-06-26T02:30:57Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/179716
dc.identifier.nrb.pt_BR.fl_str_mv 001027193
url http://hdl.handle.net/10183/179716
identifier_str_mv 001027193
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/179716/1/001027193.pdf
http://www.lume.ufrgs.br/bitstream/10183/179716/2/001027193.pdf.txt
bitstream.checksum.fl_str_mv 24c153eb0bb3fb7f118b9c10a6c3f820
d259b5578c02b5cf04b9bbfda0f7c2d5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224552818147328