Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente

Detalhes bibliográficos
Autor(a) principal: Paes, Thiago Lipinski
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/5236
Resumo: There currently are approximately 16 million of unique (non-redundant) protein sequences in the GenBank. In the PDB, we can only find about 89,000 three-dimensional (3-D) protein structures and only 1,393 different SCOP protein folds. Thus, there is a huge gap between our ability to generate protein sequences and that of solving 3-D structures of proteins with unique, novel folds. This gap has been reduced with the aid from structural bioinformatics by addressing the problem of how a protein reaches its 3-D structure starting only from its amino acid sequence. This is called the protein structure prediction (PSP) problem. Thermodynamics considerations presented by Christian Anfinsen and co-workers in 1973 have it that a protein native structure is the one that minimizes its global free energy. Hence, we can treat the PSP problem as a minimization one within an NP-complete class of computation complexity. Several techniques have been used to predict the 3-D structure of proteins. In this work we supplement these techniques by adding artificial intelligence concepts still not much exploited in bioinformatics. More specifically, we propose a framework, based on an ab initio approach, of a cooperative hierarquical multi-agent system guided by a Simulated Annealing and a Monte Carlo scheme to address the PSP problem. Our multi-agent system has as input the protein amino acid sequence. Amino acids are represented by two agents: The C-Alpha agent (in lieu of the C alpha carbon atom) and the CBeta agent (in lieu of the side chain centroid). These Amino Acid agents can interact with each other. There are two other agents: one coordinates the Amino Acid agents; the other coordinates the protein system. The multi-agent system was created using the NetLogo platform. A clustering protocol was implemented for obtaining each simulation representant model. The results were compared with published papers regarding similar methodology and the use of Multi-Agent Systems to address the Protein Structure Prediction Problem. We present partial results which are encouraging for mini proteins.
id P_RS_41108a648be412cfdc1765d00befb059
oai_identifier_str oai:tede2.pucrs.br:tede/5236
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Souza, Osmar Norberto deCPF:48604399615http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781658Z2CPF:01952046033http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4451812E0Paes, Thiago Lipinski2015-04-14T14:50:06Z2013-10-162013-03-15PAES, Thiago Lipinski. Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente. 2013. 133 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.http://tede2.pucrs.br/tede2/handle/tede/5236There currently are approximately 16 million of unique (non-redundant) protein sequences in the GenBank. In the PDB, we can only find about 89,000 three-dimensional (3-D) protein structures and only 1,393 different SCOP protein folds. Thus, there is a huge gap between our ability to generate protein sequences and that of solving 3-D structures of proteins with unique, novel folds. This gap has been reduced with the aid from structural bioinformatics by addressing the problem of how a protein reaches its 3-D structure starting only from its amino acid sequence. This is called the protein structure prediction (PSP) problem. Thermodynamics considerations presented by Christian Anfinsen and co-workers in 1973 have it that a protein native structure is the one that minimizes its global free energy. Hence, we can treat the PSP problem as a minimization one within an NP-complete class of computation complexity. Several techniques have been used to predict the 3-D structure of proteins. In this work we supplement these techniques by adding artificial intelligence concepts still not much exploited in bioinformatics. More specifically, we propose a framework, based on an ab initio approach, of a cooperative hierarquical multi-agent system guided by a Simulated Annealing and a Monte Carlo scheme to address the PSP problem. Our multi-agent system has as input the protein amino acid sequence. Amino acids are represented by two agents: The C-Alpha agent (in lieu of the C alpha carbon atom) and the CBeta agent (in lieu of the side chain centroid). These Amino Acid agents can interact with each other. There are two other agents: one coordinates the Amino Acid agents; the other coordinates the protein system. The multi-agent system was created using the NetLogo platform. A clustering protocol was implemented for obtaining each simulation representant model. The results were compared with published papers regarding similar methodology and the use of Multi-Agent Systems to address the Protein Structure Prediction Problem. We present partial results which are encouraging for mini proteins.Atualmente existem aproximadamente 16 milhões de sequências únicas de proteínas (não redundantes) no GenBank. Entretanto, no PDB, podemos encontrar apenas cerca de 85.000 estruturas tridimensionais (3D) de proteínas das quais apenas 1.393 possuem dobramento SCOP diferentes. Existe então uma grande lacuna entre nossas atuais habilidades no que se trata de gerar sequências de proteínas e nossas habilidades em resolver estruturas 3D de proteínas com novos dobramentos. Essa lacuna vem sendo reduzida com a ajuda da bioinformática estrutural por meio do endereçamento do problema de como uma proteína alcança sua estrutura 3D partindo-se apenas de sua sequencia de aminoácidos. Esse é conhecido como o Problema PSP, do inglês Protein Structure Prediction Problem. Considerações termodinâmicas apresentadas por Christian Anfinsen e colaboradores em 1973 deram inicio a uma forma de abordar o problema que hoje é conhecida como a hipótese de Anfinsen, a qual afirma que a estrutura nativa de uma proteína é aquela que minimiza sua energia global livre. Podemos então, tratar o problema PSP como um problema de minimização, tendo em mente ser um problema de complexidade NP-Completo. Neste são utilizados conceitos adventos da inteligência artificial até hoje não muito explorados na bioinformática. Mais especificamente, propomos um arcabouço baseado em uma abordagem ab initio, envolvendo um sistema multi-agente hierarquicamente cooperativo e guiado por um esquema baseado no método de Monte Carlo e de Arrefecimento Simulado, a fim de obter-se a otimização de uma função de energia. O sistema multi-agente tem como entrada apenas a sequencia de aminoácidos das proteínas. Cada aminoácido é representado por dois agentes: O agente C-Alfa (correspondendo o átomo C alfa) e um agente C-Beta (correspondendo ao centroide da cadeia lateral do aminoácido). Esses agentes aminoácidos interagem entre si. Existem dois outros tipos de agentes: um coordena os agentes Aminoácidos (C-Alfa e CBeta) e outro coordena o sistema por inteiro. O sistema multi-agente foi criado utilizando a plataforma NetLogo. Um protocolo de clusterização foi desenvolvido para a obtenção da estrutura modelo de cada simulação e os resultados foram comparados com a literatura no que se trata de PSP e multi-agentes e se mostraram promissores.Made available in DSpace on 2015-04-14T14:50:06Z (GMT). No. of bitstreams: 1 451616.pdf: 18264447 bytes, checksum: 02e74b31d71030af5f9b0355ff4fef90 (MD5) Previous issue date: 2013-03-15application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15296/451616.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICASISTEMAS MULTIAGENTESPROTEÍNASBIOLOGIA COMPUTACIONALCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOPro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagenteinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL451616.pdf.jpg451616.pdf.jpgimage/jpeg3874http://tede2.pucrs.br/tede2/bitstream/tede/5236/3/451616.pdf.jpg52bf739c03cf35e617feda9eab625a89MD53TEXT451616.pdf.txt451616.pdf.txttext/plain225030http://tede2.pucrs.br/tede2/bitstream/tede/5236/2/451616.pdf.txt19828c5070d518b10dc52d7d6bc9ee92MD52ORIGINAL451616.pdfapplication/pdf18264447http://tede2.pucrs.br/tede2/bitstream/tede/5236/1/451616.pdf02e74b31d71030af5f9b0355ff4fef90MD51tede/52362015-04-17 11:57:31.786oai:tede2.pucrs.br:tede/5236Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:31Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
title Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
spellingShingle Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
Paes, Thiago Lipinski
INFORMÁTICA
SISTEMAS MULTIAGENTES
PROTEÍNAS
BIOLOGIA COMPUTACIONAL
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
title_full Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
title_fullStr Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
title_full_unstemmed Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
title_sort Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente
author Paes, Thiago Lipinski
author_facet Paes, Thiago Lipinski
author_role author
dc.contributor.advisor1.fl_str_mv Souza, Osmar Norberto de
dc.contributor.advisor1ID.fl_str_mv CPF:48604399615
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781658Z2
dc.contributor.authorID.fl_str_mv CPF:01952046033
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4451812E0
dc.contributor.author.fl_str_mv Paes, Thiago Lipinski
contributor_str_mv Souza, Osmar Norberto de
dc.subject.por.fl_str_mv INFORMÁTICA
SISTEMAS MULTIAGENTES
PROTEÍNAS
BIOLOGIA COMPUTACIONAL
topic INFORMÁTICA
SISTEMAS MULTIAGENTES
PROTEÍNAS
BIOLOGIA COMPUTACIONAL
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description There currently are approximately 16 million of unique (non-redundant) protein sequences in the GenBank. In the PDB, we can only find about 89,000 three-dimensional (3-D) protein structures and only 1,393 different SCOP protein folds. Thus, there is a huge gap between our ability to generate protein sequences and that of solving 3-D structures of proteins with unique, novel folds. This gap has been reduced with the aid from structural bioinformatics by addressing the problem of how a protein reaches its 3-D structure starting only from its amino acid sequence. This is called the protein structure prediction (PSP) problem. Thermodynamics considerations presented by Christian Anfinsen and co-workers in 1973 have it that a protein native structure is the one that minimizes its global free energy. Hence, we can treat the PSP problem as a minimization one within an NP-complete class of computation complexity. Several techniques have been used to predict the 3-D structure of proteins. In this work we supplement these techniques by adding artificial intelligence concepts still not much exploited in bioinformatics. More specifically, we propose a framework, based on an ab initio approach, of a cooperative hierarquical multi-agent system guided by a Simulated Annealing and a Monte Carlo scheme to address the PSP problem. Our multi-agent system has as input the protein amino acid sequence. Amino acids are represented by two agents: The C-Alpha agent (in lieu of the C alpha carbon atom) and the CBeta agent (in lieu of the side chain centroid). These Amino Acid agents can interact with each other. There are two other agents: one coordinates the Amino Acid agents; the other coordinates the protein system. The multi-agent system was created using the NetLogo platform. A clustering protocol was implemented for obtaining each simulation representant model. The results were compared with published papers regarding similar methodology and the use of Multi-Agent Systems to address the Protein Structure Prediction Problem. We present partial results which are encouraging for mini proteins.
publishDate 2013
dc.date.available.fl_str_mv 2013-10-16
dc.date.issued.fl_str_mv 2013-03-15
dc.date.accessioned.fl_str_mv 2015-04-14T14:50:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PAES, Thiago Lipinski. Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente. 2013. 133 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5236
identifier_str_mv PAES, Thiago Lipinski. Pro-smart : predição de estruturas terciárias de proteínas utilizando sistemas multiagente. 2013. 133 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.
url http://tede2.pucrs.br/tede2/handle/tede/5236
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Informáca
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5236/3/451616.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5236/2/451616.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5236/1/451616.pdf
bitstream.checksum.fl_str_mv 52bf739c03cf35e617feda9eab625a89
19828c5070d518b10dc52d7d6bc9ee92
02e74b31d71030af5f9b0355ff4fef90
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765306222051328