Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do LNCC |
Texto Completo: | https://tede.lncc.br/handle/tede/354 |
Resumo: | A metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos. |
id |
LNCC_1e4881fa1ce432ced5858c1119d49cfc |
---|---|
oai_identifier_str |
oai:tede-server.lncc.br:tede/354 |
network_acronym_str |
LNCC |
network_name_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository_id_str |
|
spelling |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThorAtracamento molecularMolecular dockingAlgorítmos genéticosBioinformáticaDockThor (Programa de computador)CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERALA metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos.The molecular docking methodology is a significant tool in Structure Based Drug Design, which aims to find the binding mode of a small molecule with a receptor as well as its binding affinity. This technique helps to reduce the cost, time and number of failures in the development of new drugs. The DockThor molecular docking program developed in the Molecular Modeling of Biological Systems Group at LNCC, hosted at <dockthor. lncc.br> and implemented in the Santos Dumont supercomputer serves the national and international scientific community and its number of accesses grows every year. Even though DockThor program presents competitive performance with state-of-the-art programs, DockThor is not competitive in terms of execution time, which makes it difficult and expensive to use in virtual screening experiments containing millions of compounds. In this work, we developed the adaptation of the grid calculation step so that it could be used more efficiently in GPU devices. This improvement enabled a significant performance increase (20 times), which computationally enables the implementation of several ensemble docking strategies and the composition of multiple grids. The structures involved in the steps of the genetic algorithm of multiples mimima were also adapted using phenotypic crowding. A version of the steady-state algorithm was implemented with the same energy accuracy and performance gain of more than 30% in the evolution. This result implies a better performance in virtual screening experiments. Aiming at obtaining computational performance in GPU-like architectures, a new generational algorithm was developed that was capable of performing the independent evolution steps and with the characteristic of being individually parallelized. This new algorithm, which also takes advantage of coalescing structures, performed well in the energetic analysis of the test set and prediction of the native pose of receptor-ligand complexes. Finally, a new generational algorithm was designed in OpenCL (from the generational produced and tested) that performed all stages of evolution on the GPU, with no data communication with the CPU during the evolution of the algorithm. This generational GPU algorithm achieved the energy accuracies of the original steady-state and still achieving a performance of 3.9 to 7.3 times faster than the original algorithm that performed all stages of evolution on the GPU, with no data communication with the CPU during the evolution of the algorithm. This algorithm achieved the energy accuracies of the original steady-state and still achieving a performance of 3.9 to 7.3 times faster than the original algorithm. The results obtained in this work point to the feasibility of using the DockThor program in virtual screenings containing millions of compounds.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorLaboratório Nacional de Computação CientíficaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BrasilLNCCPrograma de Pós-Graduação em Modelagem ComputacionalDardenne, Laurent EmmanuelAugusto, Douglas AdrianoGomes, Antonio Tadeu AzevedoBarbosa, Helio José CorreaSant'Anna, Carlos Maurício Rabello dePascutti, Pedro GeraldoLeão, Aaron Bruno2023-04-18T17:53:42Z2022-03-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022.https://tede.lncc.br/handle/tede/354porhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-06-02T15:04:46Zoai:tede-server.lncc.br:tede/354Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:04:46Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false |
dc.title.none.fl_str_mv |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
title |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
spellingShingle |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor Leão, Aaron Bruno Atracamento molecular Molecular docking Algorítmos genéticos Bioinformática DockThor (Programa de computador) CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
title_short |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
title_full |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
title_fullStr |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
title_full_unstemmed |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
title_sort |
Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor |
author |
Leão, Aaron Bruno |
author_facet |
Leão, Aaron Bruno |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dardenne, Laurent Emmanuel Augusto, Douglas Adriano Gomes, Antonio Tadeu Azevedo Barbosa, Helio José Correa Sant'Anna, Carlos Maurício Rabello de Pascutti, Pedro Geraldo |
dc.contributor.author.fl_str_mv |
Leão, Aaron Bruno |
dc.subject.por.fl_str_mv |
Atracamento molecular Molecular docking Algorítmos genéticos Bioinformática DockThor (Programa de computador) CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
topic |
Atracamento molecular Molecular docking Algorítmos genéticos Bioinformática DockThor (Programa de computador) CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
description |
A metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-03-30 2023-04-18T17:53:42Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
LEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022. https://tede.lncc.br/handle/tede/354 |
identifier_str_mv |
LEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022. |
url |
https://tede.lncc.br/handle/tede/354 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) Brasil LNCC Programa de Pós-Graduação em Modelagem Computacional |
publisher.none.fl_str_mv |
Laboratório Nacional de Computação Científica Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) Brasil LNCC Programa de Pós-Graduação em Modelagem Computacional |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
instname_str |
Laboratório Nacional de Computação Científica (LNCC) |
instacron_str |
LNCC |
institution |
LNCC |
reponame_str |
Biblioteca Digital de Teses e Dissertações do LNCC |
collection |
Biblioteca Digital de Teses e Dissertações do LNCC |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC) |
repository.mail.fl_str_mv |
library@lncc.br||library@lncc.br |
_version_ |
1816081207290494976 |