Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas

Detalhes bibliográficos
Autor(a) principal: Goliatt, Priscila Vanessa Zabala Capriles
Data de Publicação: 2011
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/157
Resumo: The knowledge of the three-dimensional (3D) conformation of the native structure of proteins has assisted biotechnological researches as those focused on protein design and structure based drug design. As an alternative to the techniques of experimental prediction and theoretical prediction via comparative modeling, the theoretical prediction via ab initio technique has been increasingly exploited. In the ab initio technique, the 3D protein structure prediction (PSP) is performed based only on its amino acid sequence and in their physicochemical properties. However, to obtain solutions that represent native structures, methods of ab initio PSP require a large number of function evaluations which limits their use in studies of more complex proteins. In the CG model, the representation of each amino acid is reduced to a set of few interaction sites, significantly reducing the number of degrees of freedom to be treated, and thus reducing the computational cost needed to evaluate each structure during the optimization process. In this work, we developed and implemented a CG model applied to the PSP problem, including the ability to simulate the presence of disulfide bonds. This model was adapted to the GAPF program (Genetic Algorithm for Protein Folding), previously developed by the "Grupo de Modelagem Molecular de Sistemas Biológicos" (GMMSB/ LNCC) and originally implemented for the PSP via ab initio technique using an all-atom model representation. The CG model has been tested on a set of 36 structures with sizes ranging from 18 to 106 amino acid residues, and covering the different classes of proteins (i.e. mainly alpha, alpha+beta and mainly beta). The results showed that the CG model proposed promoted improvements in predictive ability of GAPF program, now being able to predict β-sheet structures, and a decrease of approximately 80% of computational time.
id LNCC_59b731d78821bdc7d7fcf09a3c5b7387
oai_identifier_str oai:tede-server.lncc.br:tede/157
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Dardenne, Laurent EmmanuelCPF:49809431104http://lattes.cnpq.br/8344194525615133Garratt, Richard CharlesCPF:00000000004http://lattes.cnpq.br/1405100203133067Barbosa, Helio José CorrêaCPF:194 306 716 34http://lattes.cnpq.br/0375745110240885Silva, Fernando Luís Barroso daCPF:19142394821http://lattes.cnpq.br/0740745836565262CPF:05235673751http://lattes.cnpq.br/3074561832181610Goliatt, Priscila Vanessa Zabala Capriles2015-03-04T18:57:49Z2013-07-092011-06-27https://tede.lncc.br/handle/tede/157The knowledge of the three-dimensional (3D) conformation of the native structure of proteins has assisted biotechnological researches as those focused on protein design and structure based drug design. As an alternative to the techniques of experimental prediction and theoretical prediction via comparative modeling, the theoretical prediction via ab initio technique has been increasingly exploited. In the ab initio technique, the 3D protein structure prediction (PSP) is performed based only on its amino acid sequence and in their physicochemical properties. However, to obtain solutions that represent native structures, methods of ab initio PSP require a large number of function evaluations which limits their use in studies of more complex proteins. In the CG model, the representation of each amino acid is reduced to a set of few interaction sites, significantly reducing the number of degrees of freedom to be treated, and thus reducing the computational cost needed to evaluate each structure during the optimization process. In this work, we developed and implemented a CG model applied to the PSP problem, including the ability to simulate the presence of disulfide bonds. This model was adapted to the GAPF program (Genetic Algorithm for Protein Folding), previously developed by the "Grupo de Modelagem Molecular de Sistemas Biológicos" (GMMSB/ LNCC) and originally implemented for the PSP via ab initio technique using an all-atom model representation. The CG model has been tested on a set of 36 structures with sizes ranging from 18 to 106 amino acid residues, and covering the different classes of proteins (i.e. mainly alpha, alpha+beta and mainly beta). The results showed that the CG model proposed promoted improvements in predictive ability of GAPF program, now being able to predict β-sheet structures, and a decrease of approximately 80% of computational time.O conhecimento da conformação tridimensional (3D) da estrutura nativa de uma proteína tem auxiliado pesquisas biotecnológicas como as voltadas à engenharia de proteínas e ao desenho racional de fármacos. Como alternativa às técnicas de predição experimental e à técnica de predição teórica via modelagem comparativa, a técnica de predição teórica via ab initio tem sido cada vez mais explorada. Na técnica ab initio, a predição da estrutura 3D de uma proteína (PSP) é feita baseando-se apenas na sua sequência de resíduos de aminoácidos e nas propriedades físico-químicas dos mesmos. Entretanto, os métodos de PSP ab initio, para chegarem à soluções que representem estruturas nativas, requerem um grande número de avaliações de função o que limita suas aplicações em estudos de proteínas mais complexas. Uma possível solução para este problema é o uso de uma representação simplificada do sistema (modelo coarse-grained - CG). No modelo CG, a representação de cada aminoácido é reduzida a um conjunto de poucos sítios de interação, diminuindo significativamente o número de graus de liberdade a serem tratados e, portanto, reduzindo o custo computacional necessário na avaliação de cada estrutura durante o processo de otimização. Neste trabalho, foi desenvolvido e implementado um modelo CG aplicado ao problema de predição de estruturas 3D de proteínas, incluindo-se a possibilidade de simular a presença de ligações dissulfídicas. Este modelo foi adaptado ao programa GAPF (Genetic Algorithm for Protein Folding), previamente desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos (GMMSB/ LNCC) e originalmente implementado para a PSP via técnica ab initio usando um modelo de representação de todos os átomos do sistema. O modelo CG desenvolvido foi testado em um conjunto de 36 estruturas, de tamanhos variando entre 18 e 106 resíduos de aminoácidos, e abrangendo as distintas classes de proteínas (i.e. preferencialmente alfa, alfa+beta e preferencialmente beta). Os resultados obtidos mostraram que o modelo CG proposto resultou em melhorias na capacidade preditiva do programa GAPF, sendo agora capaz de predizer conformações em folha-β, e na redução de aproximadamente 80% do tempo computacional.Made available in DSpace on 2015-03-04T18:57:49Z (GMT). No. of bitstreams: 1 GOLIATT_PVZC_thesis.pdf: 13370494 bytes, checksum: 2621901d59798613ae8fdb2d938dda20 (MD5) Previous issue date: 2011-06-27application/pdfhttp://tede-server.lncc.br:8080/retrieve/465/GOLIATT_PVZC_thesis.pdf.jpghttp://tede-server.lncc.br:8080/retrieve/680/GOLIATT_PVZC_thesis.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBRCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)Estrutura molecularAlgorítmos genéticosGenetic algorithmsMolecular structureCNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULARDesenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínasDevelopment and implementation of a coarse-grained model for protein structure predictioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCORIGINALGOLIATT_PVZC_thesis.pdfapplication/pdf13370494http://tede-server.lncc.br:8080/tede/bitstream/tede/157/1/GOLIATT_PVZC_thesis.pdf2621901d59798613ae8fdb2d938dda20MD51THUMBNAILGOLIATT_PVZC_thesis.pdf.jpgGOLIATT_PVZC_thesis.pdf.jpgimage/jpeg3273http://tede-server.lncc.br:8080/tede/bitstream/tede/157/2/GOLIATT_PVZC_thesis.pdf.jpga7b74e6cfa252743c98aa57b5f8181f8MD52tede/1572023-06-02 11:49:29.723oai:tede-server.lncc.br:tede/157Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T14:49:29Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
dc.title.alternative.eng.fl_str_mv Development and implementation of a coarse-grained model for protein structure prediction
title Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
spellingShingle Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
Goliatt, Priscila Vanessa Zabala Capriles
Estrutura molecular
Algorítmos genéticos
Genetic algorithms
Molecular structure
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
title_short Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_full Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_fullStr Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_full_unstemmed Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
title_sort Desenvolvimento e implementação de um modelo Coarse-Grained para predição de estruturas de proteínas
author Goliatt, Priscila Vanessa Zabala Capriles
author_facet Goliatt, Priscila Vanessa Zabala Capriles
author_role author
dc.contributor.advisor1.fl_str_mv Dardenne, Laurent Emmanuel
dc.contributor.advisor1ID.fl_str_mv CPF:49809431104
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8344194525615133
dc.contributor.referee1.fl_str_mv Garratt, Richard Charles
dc.contributor.referee1ID.fl_str_mv CPF:00000000004
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/1405100203133067
dc.contributor.referee2.fl_str_mv Barbosa, Helio José Corrêa
dc.contributor.referee2ID.fl_str_mv CPF:194 306 716 34
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/0375745110240885
dc.contributor.referee3.fl_str_mv Silva, Fernando Luís Barroso da
dc.contributor.referee3ID.fl_str_mv CPF:19142394821
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/0740745836565262
dc.contributor.authorID.fl_str_mv CPF:05235673751
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3074561832181610
dc.contributor.author.fl_str_mv Goliatt, Priscila Vanessa Zabala Capriles
contributor_str_mv Dardenne, Laurent Emmanuel
Garratt, Richard Charles
Barbosa, Helio José Corrêa
Silva, Fernando Luís Barroso da
dc.subject.por.fl_str_mv Estrutura molecular
Algorítmos genéticos
topic Estrutura molecular
Algorítmos genéticos
Genetic algorithms
Molecular structure
CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
dc.subject.eng.fl_str_mv Genetic algorithms
Molecular structure
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS::BIOQUIMICA::BIOLOGIA MOLECULAR
description The knowledge of the three-dimensional (3D) conformation of the native structure of proteins has assisted biotechnological researches as those focused on protein design and structure based drug design. As an alternative to the techniques of experimental prediction and theoretical prediction via comparative modeling, the theoretical prediction via ab initio technique has been increasingly exploited. In the ab initio technique, the 3D protein structure prediction (PSP) is performed based only on its amino acid sequence and in their physicochemical properties. However, to obtain solutions that represent native structures, methods of ab initio PSP require a large number of function evaluations which limits their use in studies of more complex proteins. In the CG model, the representation of each amino acid is reduced to a set of few interaction sites, significantly reducing the number of degrees of freedom to be treated, and thus reducing the computational cost needed to evaluate each structure during the optimization process. In this work, we developed and implemented a CG model applied to the PSP problem, including the ability to simulate the presence of disulfide bonds. This model was adapted to the GAPF program (Genetic Algorithm for Protein Folding), previously developed by the "Grupo de Modelagem Molecular de Sistemas Biológicos" (GMMSB/ LNCC) and originally implemented for the PSP via ab initio technique using an all-atom model representation. The CG model has been tested on a set of 36 structures with sizes ranging from 18 to 106 amino acid residues, and covering the different classes of proteins (i.e. mainly alpha, alpha+beta and mainly beta). The results showed that the CG model proposed promoted improvements in predictive ability of GAPF program, now being able to predict β-sheet structures, and a decrease of approximately 80% of computational time.
publishDate 2011
dc.date.issued.fl_str_mv 2011-06-27
dc.date.available.fl_str_mv 2013-07-09
dc.date.accessioned.fl_str_mv 2015-03-04T18:57:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/157
url https://tede.lncc.br/handle/tede/157
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/157/1/GOLIATT_PVZC_thesis.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/157/2/GOLIATT_PVZC_thesis.pdf.jpg
bitstream.checksum.fl_str_mv 2621901d59798613ae8fdb2d938dda20
a7b74e6cfa252743c98aa57b5f8181f8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1797683217858297856