Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do LNCC |
Texto Completo: | https://tede.lncc.br/handle/tede/105 |
Resumo: | As the genome sequencing advances, the comprehension of protein structures becomes a crucial extension to these progresses. In spite of the numerous recent technological advances, experimental determination of protein terciary structures is still very slow compared to the accumulated data from amino acid sequences. That is what makes the protein folding a central problem to the development of the pots-genomic era. In this work we use an optimization method, the Generalized Simulated Annealing (GSA), which is based on Tsallis' generalized thermostatistics, to investigate the protein folding problem. Although GSA is a generic procedure, its efficiency depends not only on the appropriate choice of parameters, but also on topological characteristics of the energy hypersurface. By mapping all the GSA parameters, it can be possible to reduce the number of possible choices of them. That also allows an analysis of its effects on the algorithm behavior. As a initial step, we apply GSA to known structures, such as polyalanines. In sequence, we also apply GSA to three more peptides of ribosomal P proteins, which are of considerable importance on the comprehension of Chagas' heart disease. Each one contains 13 amino acids and differ only on the third residue by a non-conservative mutation. As these peptides do not have experimentally resolved structure, we analyze results obtained from GSA followed by Molecular Dynamics simulations. Validity of these results is studied such that, in the future, unknown structures can be determined by this technique with a higher degree of confidence. |
id |
LNCC_93788e13114a3b3a20f3a6fb071516b8 |
---|---|
oai_identifier_str |
oai:tede-server.lncc.br:tede/105 |
network_acronym_str |
LNCC |
network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository_id_str |
|
spelling |
Pascutti, Pedro Geraldohttp://lattes.cnpq.br/61425584109227273Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Simões, Renatohttp://lattes.cnpq.br/4587299173539062Caffarena, Ernesto RaúlCPF:05509835702http://lattes.cnpq.br/8742778337409951Caliri, Antoniohttp://lattes.cnpq.br/8755654103422598CPF:07375759723http://lattes.cnpq,.br/7437890505918073Agostini, Flavia Paiva2015-03-04T18:51:09Z2009-08-192008-06-06AGOSTINI, F. P. Mapeamento de parâmetros do simulated annealing generalizado aplicado ao problema do enovelamento de proteínas. 2008. 145 f. Tese (Doutorado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petropolis, 2008.https://tede.lncc.br/handle/tede/105As the genome sequencing advances, the comprehension of protein structures becomes a crucial extension to these progresses. In spite of the numerous recent technological advances, experimental determination of protein terciary structures is still very slow compared to the accumulated data from amino acid sequences. That is what makes the protein folding a central problem to the development of the pots-genomic era. In this work we use an optimization method, the Generalized Simulated Annealing (GSA), which is based on Tsallis' generalized thermostatistics, to investigate the protein folding problem. Although GSA is a generic procedure, its efficiency depends not only on the appropriate choice of parameters, but also on topological characteristics of the energy hypersurface. By mapping all the GSA parameters, it can be possible to reduce the number of possible choices of them. That also allows an analysis of its effects on the algorithm behavior. As a initial step, we apply GSA to known structures, such as polyalanines. In sequence, we also apply GSA to three more peptides of ribosomal P proteins, which are of considerable importance on the comprehension of Chagas' heart disease. Each one contains 13 amino acids and differ only on the third residue by a non-conservative mutation. As these peptides do not have experimentally resolved structure, we analyze results obtained from GSA followed by Molecular Dynamics simulations. Validity of these results is studied such that, in the future, unknown structures can be determined by this technique with a higher degree of confidence.Com os rápidos avanços no seqüenciamento do genoma, a compreensão da estrutura de proteínas torna-se uma extensão crucial a esses progressos. Apesar dos significativos avanços tecnológicos recentes, a determinação experimental da estrutura terciária de proteínas ainda é muito lenta se comparada com a taxa de acúmulo de dados das seqüências de aminoácidos. Isto torna o enovelamento de proteínas um problema central para o desenvolvimento da biologia pós-genômica. Em nosso trabalho, fazemos uso de um método de otimização, o Generalized Simulated Annealing (GSA), baseado na termoestatística generalizada por Tsallis. Embora o GSA seja um procedimento geral, sua eficiência depende não apenas da escolha apropriada de parâmetros, mas também das características topológicas da hiper--superfície de energia da função custo. Com o mapeamento dos parâmetros necessários à aplicação do GSA, pode-se reduzir significativamente o número de escolhas, além de tornar possível uma análise do efeito dos parâmetros no comportamento do algoritmo. Como passo inicial, usamos estruturas conhecidas, com as quais os resultados obtidos com o GSA possam ser comparados, como é o caso das polialaninas. Além disso, aplicamos, o GSA a três peptídeos de proteínas ribossomais da família P, de considerável importância no estudo da doença de Chagas. Cada um possui 13 aminoácidos, diferindo em apenas uma mutação não conservativa no terceiro aminoácido. Como os peptídeos não possuem estrutura experimentalmente resolvida, analisamos os resultados obtidos com GSA seguidos por simulações de Dinâmica Molecular. A validade destes resultados é estudada, de forma que, no futuro, estruturas desconhecidas possam ser determinadas com certo grau de confiabilidade.Made available in DSpace on 2015-03-04T18:51:09Z (GMT). No. of bitstreams: 1 TeseFlavia.pdf: 12428230 bytes, checksum: 6fb8e9ea53da0aa51093c702fb32bc4a (MD5) Previous issue date: 2009-06-06Coordenacao de Aperfeicoamento de Pessoal de Nivel Superiorapplication/pdfhttp://tede-server.lncc.br:8080/retrieve/467/TeseFlavia.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/682/TeseFlavia.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRServiço de Análise e Apoio a Formação de Recursos HumanosProteínas-EstruturaOtimização MatemáticaGeneralized Simulated Annealing (GSA)Protein - StructuresOptimization MathematicaGeneralized Simulated Annealing (GSA)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de ProteínasGeneralized Simulated Annealing Parameter Sweeping Applied to the Protein Folding Probleminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALTeseFlavia.pdfapplication/pdf12428230http://tede-server.lncc.br:8080/tede/bitstream/tede/105/1/TeseFlavia.pdf6fb8e9ea53da0aa51093c702fb32bc4aMD51THUMBNAILTeseFlavia.pdf.jpgTeseFlavia.pdf.jpgimage/jpeg3228http://tede-server.lncc.br:8080/tede/bitstream/tede/105/2/TeseFlavia.pdf.jpgf9d4cc17714dec5f740094f1777d00bbMD52tede/1052023-05-18 12:13:09.788oai:tede-server.lncc.br:tede/105Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-05-18T15:13:09Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
dc.title.por.fl_str_mv |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
dc.title.alternative.eng.fl_str_mv |
Generalized Simulated Annealing Parameter Sweeping Applied to the Protein Folding Problem |
title |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
spellingShingle |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas Agostini, Flavia Paiva Proteínas-Estrutura Otimização Matemática Generalized Simulated Annealing (GSA) Protein - Structures Optimization Mathematica Generalized Simulated Annealing (GSA) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
title_full |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
title_fullStr |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
title_full_unstemmed |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
title_sort |
Mapeamento de Parâmetros do Simulated Annealing Generalizado aplicado ao problema do Enovelamento de Proteínas |
author |
Agostini, Flavia Paiva |
author_facet |
Agostini, Flavia Paiva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Pascutti, Pedro Geraldo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/61425584109227273 |
dc.contributor.referee1.fl_str_mv |
Dardenne, Laurent Emmanuel |
dc.contributor.referee1ID.fl_str_mv |
CPF:49809431104 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/8344194525615133 |
dc.contributor.referee2.fl_str_mv |
Simões, Renato |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/4587299173539062 |
dc.contributor.referee3.fl_str_mv |
Caffarena, Ernesto Raúl |
dc.contributor.referee3ID.fl_str_mv |
CPF:05509835702 |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/8742778337409951 |
dc.contributor.referee4.fl_str_mv |
Caliri, Antonio |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/8755654103422598 |
dc.contributor.authorID.fl_str_mv |
CPF:07375759723 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq,.br/7437890505918073 |
dc.contributor.author.fl_str_mv |
Agostini, Flavia Paiva |
contributor_str_mv |
Pascutti, Pedro Geraldo Dardenne, Laurent Emmanuel Simões, Renato Caffarena, Ernesto Raúl Caliri, Antonio |
dc.subject.por.fl_str_mv |
Proteínas-Estrutura Otimização Matemática Generalized Simulated Annealing (GSA) |
topic |
Proteínas-Estrutura Otimização Matemática Generalized Simulated Annealing (GSA) Protein - Structures Optimization Mathematica Generalized Simulated Annealing (GSA) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Protein - Structures Optimization Mathematica Generalized Simulated Annealing (GSA) |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
As the genome sequencing advances, the comprehension of protein structures becomes a crucial extension to these progresses. In spite of the numerous recent technological advances, experimental determination of protein terciary structures is still very slow compared to the accumulated data from amino acid sequences. That is what makes the protein folding a central problem to the development of the pots-genomic era. In this work we use an optimization method, the Generalized Simulated Annealing (GSA), which is based on Tsallis' generalized thermostatistics, to investigate the protein folding problem. Although GSA is a generic procedure, its efficiency depends not only on the appropriate choice of parameters, but also on topological characteristics of the energy hypersurface. By mapping all the GSA parameters, it can be possible to reduce the number of possible choices of them. That also allows an analysis of its effects on the algorithm behavior. As a initial step, we apply GSA to known structures, such as polyalanines. In sequence, we also apply GSA to three more peptides of ribosomal P proteins, which are of considerable importance on the comprehension of Chagas' heart disease. Each one contains 13 amino acids and differ only on the third residue by a non-conservative mutation. As these peptides do not have experimentally resolved structure, we analyze results obtained from GSA followed by Molecular Dynamics simulations. Validity of these results is studied such that, in the future, unknown structures can be determined by this technique with a higher degree of confidence. |
publishDate |
2008 |
dc.date.issued.fl_str_mv |
2008-06-06 |
dc.date.available.fl_str_mv |
2009-08-19 |
dc.date.accessioned.fl_str_mv |
2015-03-04T18:51:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
AGOSTINI, F. P. Mapeamento de parâmetros do simulated annealing generalizado aplicado ao problema do enovelamento de proteínas. 2008. 145 f. Tese (Doutorado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petropolis, 2008. |
dc.identifier.uri.fl_str_mv |
https://tede.lncc.br/handle/tede/105 |
identifier_str_mv |
AGOSTINI, F. P. Mapeamento de parâmetros do simulated annealing generalizado aplicado ao problema do enovelamento de proteínas. 2008. 145 f. Tese (Doutorado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petropolis, 2008. |
url |
https://tede.lncc.br/handle/tede/105 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Modelagem Computacional |
dc.publisher.initials.fl_str_mv |
LNCC |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Serviço de Análise e Apoio a Formação de Recursos Humanos |
publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
instacron_str |
LNCC |
institution |
LNCC |
reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
bitstream.url.fl_str_mv |
http://tede-server.lncc.br:8080/tede/bitstream/tede/105/1/TeseFlavia.pdf http://tede-server.lncc.br:8080/tede/bitstream/tede/105/2/TeseFlavia.pdf.jpg |
bitstream.checksum.fl_str_mv |
6fb8e9ea53da0aa51093c702fb32bc4a f9d4cc17714dec5f740094f1777d00bb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
_version_ |
1797683217145266176 |