Uma Nova Amostragem de Descritores para Predição de Atividade Biológica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-BALHJU |
Resumo: | O planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%. |
id |
UFMG_c081e148ab20e2eac6803b3a9a806c16 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-BALHJU |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Loïc Pascal Gilles CerfJoão Paulo Ataide MartinsRaquel Cardoso de MeloRenato Martins AssuncaoJoão Vitor Soares Tenório2019-08-14T09:06:02Z2019-08-14T09:06:02Z2018-10-26http://hdl.handle.net/1843/ESBF-BALHJUO planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%.Machine learning methods are being used to solve different problems in the areas of bioinformatics and chemometrics. One such problem is computer-aided drug design (CADD), which uses predictive modeling to design and improve compounds that have biological activity and can be used as drugs. One of the techniques used CADD is the study of quantitative structure-activity relationships (QSAR), which allows to develop a predictive model that relates the properties of the compounds and their biological activities, this model is typically a linear regression. LQTA-QSAR is a 4D-QSAR technique, where the descriptors used for predictive model training are sampled by aligning the conformational ensemble profiles (CEP) of the compounds in a 3D grid and calculating the interaction between the CEP and a probe (it can be an atom, ion, or functional group) in each point of this grid. The problem with this sampling is that the probe crosses the CEP, when the probe falls into or close to an atom of the CEP, some descriptors presents unrealistic values. To overcome this problem, a new approach for sampling descriptors was proposed in this thesis, which uses surface expansions defined by the convex hull to construct layers around the CEP where the probe must pass. This sampling prevents the probe from passing through the points inside or too close the CEP. To validate the proposal, several experiments were carried out on sets of compounds that can be used as drugs for the treatment of several diseases. The results showed that the proposal was able to build predictive models with greater precision than the original method in the six scenarios evaluated. The highest percentage increase was 44%. We also proposed a workflow where linear regression was replaced by regression tree, which allows to build models easier to interpret. Experiments with this new workflow were also carried out in six scenarios, where in one case the precision was superior to the linear models and in the other cases it was lower, but still satisfactory.Universidade Federal de Minas GeraisUFMGAprendizado do ComputadorBioinformáticaComputaçãoQSAR (Bioquímica)QuimiometriaQSARAprendizado de MáquinaQuimiometriaUma Nova Amostragem de Descritores para Predição de Atividade Biológicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALjoaovitorsoares_tenorio.pdfapplication/pdf4421497https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/1/joaovitorsoares_tenorio.pdf6cf8bec6ef646ce47183974d94c746e6MD51TEXTjoaovitorsoares_tenorio.pdf.txtjoaovitorsoares_tenorio.pdf.txtExtracted texttext/plain108900https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/2/joaovitorsoares_tenorio.pdf.txtb562a7125ceac6cc8c2854d2d7d0b68aMD521843/ESBF-BALHJU2019-11-14 16:35:00.62oai:repositorio.ufmg.br:1843/ESBF-BALHJURepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:35Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
title |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
spellingShingle |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica João Vitor Soares Tenório QSAR Aprendizado de Máquina Quimiometria Aprendizado do Computador Bioinformática Computação QSAR (Bioquímica) Quimiometria |
title_short |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
title_full |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
title_fullStr |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
title_full_unstemmed |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
title_sort |
Uma Nova Amostragem de Descritores para Predição de Atividade Biológica |
author |
João Vitor Soares Tenório |
author_facet |
João Vitor Soares Tenório |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Loïc Pascal Gilles Cerf |
dc.contributor.referee1.fl_str_mv |
João Paulo Ataide Martins |
dc.contributor.referee2.fl_str_mv |
Raquel Cardoso de Melo |
dc.contributor.referee3.fl_str_mv |
Renato Martins Assuncao |
dc.contributor.author.fl_str_mv |
João Vitor Soares Tenório |
contributor_str_mv |
Loïc Pascal Gilles Cerf João Paulo Ataide Martins Raquel Cardoso de Melo Renato Martins Assuncao |
dc.subject.por.fl_str_mv |
QSAR Aprendizado de Máquina Quimiometria |
topic |
QSAR Aprendizado de Máquina Quimiometria Aprendizado do Computador Bioinformática Computação QSAR (Bioquímica) Quimiometria |
dc.subject.other.pt_BR.fl_str_mv |
Aprendizado do Computador Bioinformática Computação QSAR (Bioquímica) Quimiometria |
description |
O planejamento de fármacos auxiliado por computador (CADD) usa modelos preditivos para planejar e aprimorar compostos que possuem atividade biológica e podem ser usados como fármacos. O LQTA-QSAR é uma técnica para CADD, onde a amostragem dos descritores usados para treinar o modelo preditivo é feita inserindo os perfis de amostragem conformacional (PAC) dos compostos em uma grade 3D, para calcular a interação entre o PAC e uma sonda nos pontos dessa grade. O problema dessa amostragem é que quando a sonda passa por pontos internos ao PAC, são amostrados descritores com valores irreais. Essa dissertação propõe uma nova amostragem que considera o formato do PAC e impede que a sonda passe por pontos internos ou próximos demais ao PAC. Foram realizados experimentos em conjuntos de compostos usados como fármacos para tratamento de diversas doenças. A proposta conseguiu melhorar a precisão dos modelos preditivos nos seis cenários avaliados. O maior aumento percentual obtido foi de 44%. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-10-26 |
dc.date.accessioned.fl_str_mv |
2019-08-14T09:06:02Z |
dc.date.available.fl_str_mv |
2019-08-14T09:06:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-BALHJU |
url |
http://hdl.handle.net/1843/ESBF-BALHJU |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/1/joaovitorsoares_tenorio.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-BALHJU/2/joaovitorsoares_tenorio.pdf.txt |
bitstream.checksum.fl_str_mv |
6cf8bec6ef646ce47183974d94c746e6 b562a7125ceac6cc8c2854d2d7d0b68a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1797971285172551680 |