Uma Nova Amostragem de Descritores para Predição de Atividade Biológica

Detalhes bibliográficos
Autor(a) principal: João Vitor Soares Tenório
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-BALHJU
Resumo: O planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%.
id UFMG_c081e148ab20e2eac6803b3a9a806c16
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-BALHJU
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Loïc Pascal Gilles CerfJoão Paulo Ataide MartinsRaquel Cardoso de MeloRenato Martins AssuncaoJoão Vitor Soares Tenório2019-08-14T09:06:02Z2019-08-14T09:06:02Z2018-10-26http://hdl.handle.net/1843/ESBF-BALHJUO planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%.Machine learning methods are being used to solve different problems in the areas of bioinformatics and chemometrics. One such problem is computer-aided drug design (CADD), which uses predictive modeling to design and improve compounds that have biological activity and can be used as drugs. One of the techniques used CADD is the study of quantitative structure-activity relationships (QSAR), which allows to develop a predictive model that relates the properties of the compounds and their biological activities, this model is typically a linear regression. LQTA-QSAR is a 4D-QSAR technique, where the descriptors used for predictive model training are sampled by aligning the conformational ensemble profiles (CEP) of the compounds in a 3D grid and calculating the interaction between the CEP and a probe (it can be an atom, ion, or functional group) in each point of this grid. The problem with this sampling is that the probe crosses the CEP, when the probe falls into or close to an atom of the CEP, some descriptors presents unrealistic values. To overcome this problem, a new approach for sampling descriptors was proposed in this thesis, which uses surface expansions defined by the convex hull to construct layers around the CEP where the probe must pass. This sampling prevents the probe from passing through the points inside or too close the CEP. To validate the proposal, several experiments were carried out on sets of compounds that can be used as drugs for the treatment of several diseases. The results showed that the proposal was able to build predictive models with greater precision than the original method in the six scenarios evaluated. The highest percentage increase was 44%. We also proposed a workflow where linear regression was replaced by regression tree, which allows to build models easier to interpret. Experiments with this new workflow were also carried out in six scenarios, where in one case the precision was superior to the linear models and in the other cases it was lower, but still satisfactory.Universidade Federal de Minas GeraisUFMGAprendizado do ComputadorBioinformáticaComputaçãoQSAR (Bioquímica)QuimiometriaQSARAprendizado de MáquinaQuimiometriaUma Nova Amostragem de Descritores para Predição de Atividade Biológicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALjoaovitorsoares_tenorio.pdfapplication/pdf4421497https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/1/joaovitorsoares_tenorio.pdf6cf8bec6ef646ce47183974d94c746e6MD51TEXTjoaovitorsoares_tenorio.pdf.txtjoaovitorsoares_tenorio.pdf.txtExtracted texttext/plain108900https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/2/joaovitorsoares_tenorio.pdf.txtb562a7125ceac6cc8c2854d2d7d0b68aMD521843/ESBF-BALHJU2019-11-14 16:35:00.62oai:repositorio.ufmg.br:1843/ESBF-BALHJURepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:35Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
title Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
spellingShingle Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
João Vitor Soares Tenório
QSAR
Aprendizado de Máquina
Quimiometria
Aprendizado do Computador
Bioinformática
Computação
QSAR (Bioquímica)
Quimiometria
title_short Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
title_full Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
title_fullStr Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
title_full_unstemmed Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
title_sort Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
author João Vitor Soares Tenório
author_facet João Vitor Soares Tenório
author_role author
dc.contributor.advisor1.fl_str_mv Loïc Pascal Gilles Cerf
dc.contributor.referee1.fl_str_mv João Paulo Ataide Martins
dc.contributor.referee2.fl_str_mv Raquel Cardoso de Melo
dc.contributor.referee3.fl_str_mv Renato Martins Assuncao
dc.contributor.author.fl_str_mv João Vitor Soares Tenório
contributor_str_mv Loïc Pascal Gilles Cerf
João Paulo Ataide Martins
Raquel Cardoso de Melo
Renato Martins Assuncao
dc.subject.por.fl_str_mv QSAR
Aprendizado de Máquina
Quimiometria
topic QSAR
Aprendizado de Máquina
Quimiometria
Aprendizado do Computador
Bioinformática
Computação
QSAR (Bioquímica)
Quimiometria
dc.subject.other.pt_BR.fl_str_mv Aprendizado do Computador
Bioinformática
Computação
QSAR (Bioquímica)
Quimiometria
description O planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%.
publishDate 2018
dc.date.issued.fl_str_mv 2018-10-26
dc.date.accessioned.fl_str_mv 2019-08-14T09:06:02Z
dc.date.available.fl_str_mv 2019-08-14T09:06:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-BALHJU
url http://hdl.handle.net/1843/ESBF-BALHJU
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/1/joaovitorsoares_tenorio.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/2/joaovitorsoares_tenorio.pdf.txt
bitstream.checksum.fl_str_mv 6cf8bec6ef646ce47183974d94c746e6
b562a7125ceac6cc8c2854d2d7d0b68a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1797971285172551680