Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor

Detalhes bibliográficos
Autor(a) principal: Leão, Aaron Bruno
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/354
Resumo: A metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos.
id LNCC_1e4881fa1ce432ced5858c1119d49cfc
oai_identifier_str oai:tede-server.lncc.br:tede/354
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThorAtracamento molecularMolecular dockingAlgorítmos genéticosBioinformáticaDockThor (Programa de computador)CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERALA metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos.The molecular docking methodology is a significant tool in Structure Based Drug Design, which aims to find the binding mode of a small molecule with a receptor as well as its binding affinity. This technique helps to reduce the cost, time and number of failures in the development of new drugs. The DockThor molecular docking program developed in the Molecular Modeling of Biological Systems Group at LNCC, hosted at <dockthor. lncc.br> and implemented in the Santos Dumont supercomputer serves the national and international scientific community and its number of accesses grows every year. Even though DockThor program presents competitive performance with state-of-the-art programs, DockThor is not competitive in terms of execution time, which makes it difficult and expensive to use in virtual screening experiments containing millions of compounds. In this work, we developed the adaptation of the grid calculation step so that it could be used more efficiently in GPU devices. This improvement enabled a significant performance increase (20 times), which computationally enables the implementation of several ensemble docking strategies and the composition of multiple grids. The structures involved in the steps of the genetic algorithm of multiples mimima were also adapted using phenotypic crowding. A version of the steady-state algorithm was implemented with the same energy accuracy and performance gain of more than 30% in the evolution. This result implies a better performance in virtual screening experiments. Aiming at obtaining computational performance in GPU-like architectures, a new generational algorithm was developed that was capable of performing the independent evolution steps and with the characteristic of being individually parallelized. This new algorithm, which also takes advantage of coalescing structures, performed well in the energetic analysis of the test set and prediction of the native pose of receptor-ligand complexes. Finally, a new generational algorithm was designed in OpenCL (from the generational produced and tested) that performed all stages of evolution on the GPU, with no data communication with the CPU during the evolution of the algorithm. This generational GPU algorithm achieved the energy accuracies of the original steady-state and still achieving a performance of 3.9 to 7.3 times faster than the original algorithm that performed all stages of evolution on the GPU, with no data communication with the CPU during the evolution of the algorithm. This algorithm achieved the energy accuracies of the original steady-state and still achieving a performance of 3.9 to 7.3 times faster than the original algorithm. The results obtained in this work point to the feasibility of using the DockThor program in virtual screenings containing millions of compounds.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorLaboratório Nacional de Computação CientíficaCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)BrasilLNCCPrograma de Pós-Graduação em Modelagem ComputacionalDardenne, Laurent EmmanuelAugusto, Douglas AdrianoGomes, Antonio Tadeu AzevedoBarbosa, Helio José CorreaSant'Anna, Carlos Maurício Rabello dePascutti, Pedro GeraldoLeão, Aaron Bruno2023-04-18T17:53:42Z2022-03-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022.https://tede.lncc.br/handle/tede/354porhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2023-06-02T15:04:46Zoai:tede-server.lncc.br:tede/354Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-02T15:04:46Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
title Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
spellingShingle Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
Leão, Aaron Bruno
Atracamento molecular
Molecular docking
Algorítmos genéticos
Bioinformática
DockThor (Programa de computador)
CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
title_short Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
title_full Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
title_fullStr Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
title_full_unstemmed Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
title_sort Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor
author Leão, Aaron Bruno
author_facet Leão, Aaron Bruno
author_role author
dc.contributor.none.fl_str_mv Dardenne, Laurent Emmanuel
Augusto, Douglas Adriano
Gomes, Antonio Tadeu Azevedo
Barbosa, Helio José Correa
Sant'Anna, Carlos Maurício Rabello de
Pascutti, Pedro Geraldo
dc.contributor.author.fl_str_mv Leão, Aaron Bruno
dc.subject.por.fl_str_mv Atracamento molecular
Molecular docking
Algorítmos genéticos
Bioinformática
DockThor (Programa de computador)
CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
topic Atracamento molecular
Molecular docking
Algorítmos genéticos
Bioinformática
DockThor (Programa de computador)
CNPQ::CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
description A metodologia de atracamento molecular é uma ferramenta importante no Desenho Racional de Fármacos, que visa encontrar o modo de ligação de uma pequena molécula com um receptor tanto quanto a sua afinidade de ligação. Esta técnica ajuda a diminuir o custo, tempo e quantidade de falhas no desenvolvimento de novos fármacos. O programa de atracamento molecular DockThor desenvolvido no Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, hospedado em <dockthor.lncc.br> e implantado no supercomputador Santos Dumont atende a comunidade cientifica nacional e internacional e o seu número de acessos cresce a cada ano. Embora apresente um desempenho competitivo com os programas estado-da-arte, o DockThor não é competitivo quanto ao tempo de execução o que dificulta e encarece a sua utilização em experimentos de triagem virtual contendo milhões de compostos. Desenvolvemos neste trabalho a adaptação da etapa do cálculo da grade de maneira que fosse utilizada de forma mais eficiente em dispositivos GPU. Esta melhoria possibilitou um aumento de desempenho expressivo (20 vezes), o que viabiliza computacionalmente a implementação de diversas estratégias de ensemble docking e composição de grades múltiplas. Também foram adaptadas as estruturas envolvidas nas etapas do algoritmo genético de múltiplos mínimos utilizando crowding fenotípico. Foi implementada uma versão do algoritmo steady-state com a mesma acurácia energética e desempenho de mais de 30% na evolução. Este resultado implica em um melhor desempenho em experimentos de triagem virtual. Visando a obtenção de desempenho computacional em arquiteturas tipo GPU, foi desenvolvido um novo algoritmo geracional que fosse capaz de realizar as etapas da evolução independentes e com a característica de serem paralelizadas individualmente. Esse novo algoritmo que também usufrui das estruturas coalescentes obteve um bom desempenho nas análises energéticas do conjunto teste e de predição da pose nativa de complexos receptor-ligante. Por fim foi projetado um novo algoritmo geracional em OpenCL (a partir do geracional produzido e testado) que realizasse todas as etapas da evolução em GPU, não havendo comunicação de dados com a CPU durante a evolução do algoritmo. Este último algoritmo conseguiu as acurácias energéticas do steady-state original e ainda obtendo um desempenho de 3,9 a 7,3 vezes mais rápido que o algoritmo original. Os resultados obtidos neste trabalho apontam para uma viabilização do uso do programa DockThor em triagens virtuais envolvendo milhões de compostos.
publishDate 2022
dc.date.none.fl_str_mv 2022-03-30
2023-04-18T17:53:42Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022.
https://tede.lncc.br/handle/tede/354
identifier_str_mv LEÃO, A. B. Estratégias de otimização e paralelização massiva do programa de atracamento molecular DockThor. 2022. 166 f. Tese (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2022.
url https://tede.lncc.br/handle/tede/354
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1816081207290494976