3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor

Detalhes bibliográficos
Autor(a) principal: Winck, Ana Trindade
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/5156
Resumo: With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x,y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi,xf );(yi,yf );(zi,zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experiments
id P_RS_c0bfcae5f926be3aa6e1f12174668a0c
oai_identifier_str oai:tede2.pucrs.br:tede/5156
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Ruiz, Duncan Dubugras AlcobaCPF:38192985091http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783178Y6CPF:82019274000http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4139987A2Winck, Ana Trindade2015-04-14T14:49:41Z2012-02-032012-01-17WINCK, Ana Trindade. 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor. 2012. 108 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.http://tede2.pucrs.br/tede2/handle/tede/5156With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x,y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi,xf );(yi,yf );(zi,zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experimentsCom o avanço nos experimentos biológicos, a manipulação e análise do grande volume de dadossendo gerados por esses experimentos têm sido um dos desafios em bioinformática, onde umaimportante área de pesquisa é o desenho racional de fármacos (RDD - Rational Drug Desing). Ainteração entre macromoléculas biológicas, chamadas de receptores, e pequenas moléculas, chamadasligantes, é o princípio fundamental do RDD. É em experimentos in silico de docagem molecularque se investiga o melhor encaixe e conformação de um ligante em uma cavidade do receptor. Oresultado de um experimento de docagem pode ser avaliado a partir de um valor contínuo de energialivre de ligação (FEB - Free Energy of Binding). Tem-se empregado esforços em minerar dados deresultados de docagem molecular, com o objetivo de selecionar conformações relevantes para reduziro tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um repositório paraarmazenar todos os dados a respeito desses experimentos, em nível de detalhe. Com esse repositório,os dados foram devidamente pré-processados e submetidos a diferentes tarefas de mineraçãode dados. Dentre as técnicas aplicadas, a que apresentou-se mais promissora para o tipo de dadossendo utilizado foi árvore de decisão para regressão. Apesar dos resultados alcançados por essesexperimentos serem promissores, existem algumas propriedades nos experimentos que dificultam aefetiva seleção de conformações. Dessa forma, propõe-se uma estratégia que considera as propriedadestridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese é apresentadoo 3D-Tri, um algoritmo de indução de árvore de regressão que considera essas propriedades 3D,onde essas propriedades são definidas como atributos no formato x,y,z. O algoritmo proposto fazuso dessas coordenadas para dividir um nodo em duas partes, onde o átomo sendo testado parao nodo é avaliado em termos de sua posição em um bloco [(xi,xf );(yi,yf );(zi,zf )] que melhorrepresente sua posição no espaço, onde i indica a posição inicial de uma coordenada, e f indicaa posição final. O modelo induzido pode ser útil para um especialista de domínio para selecionarconformações promissoras do receptor, tendo como base as regiões dos átomos que aparecem nomodelo e que indicam melhores valores de FEBMade available in DSpace on 2015-04-14T14:49:41Z (GMT). No. of bitstreams: 1 436381.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5) Previous issue date: 2012-01-17application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15843/436381.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICABIOLOGIA COMPUTACIONALMINERAÇÃO DE DADOS (INFORMÁTICA)DINÂMICA MOLECULARCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptorinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL436381.pdf.jpg436381.pdf.jpgimage/jpeg4001http://tede2.pucrs.br/tede2/bitstream/tede/5156/3/436381.pdf.jpg8a7606b3893993ae96cb94249797a787MD53TEXT436381.pdf.txt436381.pdf.txttext/plain194124http://tede2.pucrs.br/tede2/bitstream/tede/5156/2/436381.pdf.txt03c5627defa6ab68cacbbb877b83726fMD52ORIGINAL436381.pdfapplication/pdf5238803http://tede2.pucrs.br/tede2/bitstream/tede/5156/1/436381.pdfca22d61f2fb4075e277ed531aee231ceMD51tede/51562015-04-17 11:57:32.386oai:tede2.pucrs.br:tede/5156Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
title 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
spellingShingle 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
Winck, Ana Trindade
INFORMÁTICA
BIOLOGIA COMPUTACIONAL
MINERAÇÃO DE DADOS (INFORMÁTICA)
DINÂMICA MOLECULAR
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
title_full 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
title_fullStr 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
title_full_unstemmed 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
title_sort 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor
author Winck, Ana Trindade
author_facet Winck, Ana Trindade
author_role author
dc.contributor.advisor1.fl_str_mv Ruiz, Duncan Dubugras Alcoba
dc.contributor.advisor1ID.fl_str_mv CPF:38192985091
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783178Y6
dc.contributor.authorID.fl_str_mv CPF:82019274000
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4139987A2
dc.contributor.author.fl_str_mv Winck, Ana Trindade
contributor_str_mv Ruiz, Duncan Dubugras Alcoba
dc.subject.por.fl_str_mv INFORMÁTICA
BIOLOGIA COMPUTACIONAL
MINERAÇÃO DE DADOS (INFORMÁTICA)
DINÂMICA MOLECULAR
topic INFORMÁTICA
BIOLOGIA COMPUTACIONAL
MINERAÇÃO DE DADOS (INFORMÁTICA)
DINÂMICA MOLECULAR
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x,y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi,xf );(yi,yf );(zi,zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experiments
publishDate 2012
dc.date.available.fl_str_mv 2012-02-03
dc.date.issued.fl_str_mv 2012-01-17
dc.date.accessioned.fl_str_mv 2015-04-14T14:49:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv WINCK, Ana Trindade. 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor. 2012. 108 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5156
identifier_str_mv WINCK, Ana Trindade. 3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor. 2012. 108 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2012.
url http://tede2.pucrs.br/tede2/handle/tede/5156
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Informáca
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5156/3/436381.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5156/2/436381.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5156/1/436381.pdf
bitstream.checksum.fl_str_mv 8a7606b3893993ae96cb94249797a787
03c5627defa6ab68cacbbb877b83726f
ca22d61f2fb4075e277ed531aee231ce
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765305978781696