Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.

Detalhes bibliográficos
Autor(a) principal: Avila, Henrique de Vasconcellos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/102879
Resumo: Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia
id RCAP_31a5449acc7e6e7b6e058f257a4fd432
oai_identifier_str oai:estudogeral.uc.pt:10316/102879
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.Estratégias de validação para modelos generativos profundos baseadas em docking - E a busca por novos ligantes para A2aR, JAK2, KOR AND USP7.Avaliação de modelosDesenho de FármacosDocking MolecularModelos Generativos ProfundosSimulação de Dinâmica MolecularBenchmakingDeep Generative modelsDrug DesignMolecular DockingMolecular Dynamics SimulationDissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e TecnologiaDrug discovery is a highly time-consuming, complex, and expensive process with low success rates. Recent estimates point out that an average of $1.8 billion and twelve years of work are required to launch a new drug. This state of affairs is partly due to how high-dimensional the chemical space is, as it has been estimated to include between 10^33 and 10^60 synthetically accessible molecules. Evaluating the entire chemical space is prohibitively expensive, so it is of the utmost importance to find ways of narrowing down the search space. To this goal, artificial intelligence has recently been incorporated into drug discovery in many forms; among them, deep generative models have shown great potential for producing putative drug candidates. Even so, this technology is still in its infancy and possesses some fundamental flaws; for instance, these models hardly ever account for tridimensional molecular information or are validated through life-like methods. This work aims to help this process with the provided molecular docking-based validation system for deep learning generative models, bridging their bountiful potential with drug discovery. The screening methodology was tested through analyses of case studies of four high-interest pharmacologic targets (A2aR, JAK2, KOR, and USP7). It consisted of three stages: crystal structures and docking tools assessment, molecule screening testing and application, and validation through molecular dynamics simulation. In these experiments, Autodock Fr and VINA demonstrated the highest performance on both accurately predicting molecular interaction and cross-docking. In the second stage, the exponential consensus scoring technique was evaluated, compared to other predictive standards, and displayed high acuity, correctly placing over 85% of the positive controls within very strict margins (5%); it was subsequently, applied to sets of molecules produced by deep machine learning for computer-aided drug design. In validation, a clear difference in ligand-receptor stability between the best and worst scoring molecules of the previous stage was demonstrated, indicating the reliability of the proposed methodology.It was also observed that, although the standard setup can be somewhat lengthy, the tests of subsequent generative models can be done in a far reduced time span, as the resulting data of multiple steps can simply be reused. Moreover, this method is non-redundant when compared to other traditional metrics, including logP and drug-likeness, and can be used in conjunction with these for further evaluation. Also, the data generated by this method can be used as feedback for generative models, potentially aiding in their training and increasing the quality of the molecules generated.A descoberta de medicamentos é um processo altamente demorado, complexo e caro, com baixas taxas de sucesso. Estimativas recentes apontam que para lançar um novo medicamento são necessários, em média, US$ 1,8 mil milhões e doze anos de trabalho. Essa situação se deve em parte à alta dimensionalidade do espaço químico, que estima-se incluir entre 10^33 e 10^60 moléculas sinteticamente acessíveis. Avaliar todo o espaço químico é proibitivamente caro, sendo, portanto, de extrema importância encontrar maneiras de restringir o âmbito de busca. Para tal, a inteligência artificial foi recentemente de várias maneiras incorporada na descoberta de medicamentos; dentre elas, modelos generativos profundos têm mostrado grande potencial para produzir possíveis candidatos a fármacos. Apesar disso, esta tecnologia ainda está em sua infância e possui algumas falhas fundamentais; por exemplo, tais modelos dificilmente levam em conta informações sobre configurações tridimensionais moleculares ou são validados por métodos realistas. Este trabalho visa ajudar tal processo com proposto o sistema de validação baseado em docking molecular para modelos generativos de aprendizado profundo, conectando seu vasto potencial à pesquisa de medicamentos. A metodologia de triagem foi testada por meio de análises de estudos de caso de quatro alvos farmacológicos de alto interesse (A2aR, JAK2, KOR e USP7) e consistiu em três etapas: avaliação de estruturas cristalográficas e ferramentas de docking, e teste e aplicação de triagem de moléculas e validação por meio de simulação de dinâmica molecular. Nesses experimentos, Autodock Fr e Vina demonstraram o mais alto desempenho tanto na previsão precisa da interação molecular quanto no cross-docking. Na segunda etapa, a técnica de consenso de pontuação exponencial foi avaliada, comparada a outros padrões preditivos, e apresentou alta acuidade, posicionando corretamente mais de 85% dos controles positivos dentro de margens muito restritas (5%); a metodologia foi posteriormente aplicada a conjuntos de moléculas produzidas por modelos generativos profundos para design de medicamentos. Na validação, foi demonstrada uma clara diferença na estabilidade ligante-receptor entre as moléculas de melhor e pior pontuação da etapa anterior, indicando a confiabilidade da metodologia proposta.Observou-se também que, embora a configuração padrão possa ser um pouco demorada, os testes de modelos generativos subsequentes podem ser feitos em um intervalo de tempo muito reduzido, pois os dados resultantes de várias etapas podem ser simplesmente reutilizados. Além disso, este método não é redundante quando comparado a outras métricas tradicionais, incluindo logP e drug-likeness, e pode ser usado em conjunto com estas para posterior avaliação. Os dados gerados por este método podem também ser usados como feedback para modelos generativos, auxiliando potencialmente em seu treinamento e aumentando a qualidade das moléculas geradas.2022-09-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/102879http://hdl.handle.net/10316/102879TID:203077300engAvila, Henrique de Vasconcellosinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-10-19T20:33:15Zoai:estudogeral.uc.pt:10316/102879Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:19:47.088498Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
Estratégias de validação para modelos generativos profundos baseadas em docking - E a busca por novos ligantes para A2aR, JAK2, KOR AND USP7.
title Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
spellingShingle Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
Avila, Henrique de Vasconcellos
Avaliação de modelos
Desenho de Fármacos
Docking Molecular
Modelos Generativos Profundos
Simulação de Dinâmica Molecular
Benchmaking
Deep Generative models
Drug Design
Molecular Docking
Molecular Dynamics Simulation
title_short Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
title_full Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
title_fullStr Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
title_full_unstemmed Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
title_sort Docking based strategies for the validation of deep learning generative models - And the search for novel ligands for A2aR, JAK2, KOR AND USP7.
author Avila, Henrique de Vasconcellos
author_facet Avila, Henrique de Vasconcellos
author_role author
dc.contributor.author.fl_str_mv Avila, Henrique de Vasconcellos
dc.subject.por.fl_str_mv Avaliação de modelos
Desenho de Fármacos
Docking Molecular
Modelos Generativos Profundos
Simulação de Dinâmica Molecular
Benchmaking
Deep Generative models
Drug Design
Molecular Docking
Molecular Dynamics Simulation
topic Avaliação de modelos
Desenho de Fármacos
Docking Molecular
Modelos Generativos Profundos
Simulação de Dinâmica Molecular
Benchmaking
Deep Generative models
Drug Design
Molecular Docking
Molecular Dynamics Simulation
description Dissertação de Mestrado em Bioquímica apresentada à Faculdade de Ciências e Tecnologia
publishDate 2022
dc.date.none.fl_str_mv 2022-09-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/102879
http://hdl.handle.net/10316/102879
TID:203077300
url http://hdl.handle.net/10316/102879
identifier_str_mv TID:203077300
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134091510022144