Graph kernels and neural networks for predicting yields of chemical reactions

Detalhes bibliográficos
Autor(a) principal: Braga, Diogo Filipe Ribeiro Ferreira
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/86736
Resumo: Dissertação de mestrado em Informatics Engineering
id RCAP_ede2f815a83bdad128a0135119ffcf7d
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/86736
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Graph kernels and neural networks for predicting yields of chemical reactionsMachine learningChemistryGraphsKernel methodsGraph neural networksQuímicaGrafosRedes neuronais de grafosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em Informatics EngineeringPredicting chemical reaction yields is a widely investigated problem in drug discovery due to the natu ral appearance of diseases and viruses worldwide. With the evolution and further study of machine learn ing, this area of computer science has provided alternatives that help chemists search for more effective molecule combinations. This dissertation presents two research hypotheses with different bases that seek to improve this prediction problem. The first research hypothesis is related to the support vector regression algorithm, which uses graph kernels to measure similarity between molecules and then perform the pre diction. We propose the application of non-linearity in the Weisfeiler-Lehman graph kernel to improve the measure of comparison between molecules and thus enhance the complexity of the support vector regres sion models. The second research hypothesis is related to the class of neural networks. We propose a deep learning base to solve this problem through graph neural networks, which use graph convolutional layers and global read-out operations to extract molecular features from graph-structure data. The main focus is to ensure that all models generalise well to obtain good results in experiments with unknown molecules. We performed tests on chemical data for both methods and achieved improvements. The non-linearity in graph kernels proved to be the most advantageous, having surpassed the state-of-the-art methods in one of the two global tests performed. The graph neural networks were not as effective, although they showed competitive results. Concerning neural networks, we highlight the creation of the deep learning base and the in-depth analysis of the hyperparameters to enhance further research on the reaction yield prediction problem, as this area shows immense potential in drug discovery.A previsão do rendimento de reações químicas é um problema amplamente investigado na descoberta de medicamentos devido ao aparecimento natural de doenças e vírus em todo o mundo. Com a evolução e o estudo do machine learning, esta área da ciência da computação tem oferecido alternativas que ajudam os químicos a encontrar combinações de moléculas mais eficazes. Esta dissertação apresenta duas hipóteses de pesquisa com bases distintas que procuram melhorar este problema de previsão. A primeira hipótese de pesquisa está relacionada com o algoritmo support vector regression, que usa graph kernels para medir a similaridade entre as moléculas e, em seguida, realizar a previsão. Propomos a aplicação da não-linearidade no Weisfeiler-Lehman graph kernel para melhorar a medida de comparação entre moléculas e, assim, aumentar a complexidade dos modelos support vector regression. A segunda hipótese de pesquisa está relacionada com as redes neuronais. Propomos uma base de deep learning para resolver este problema através de redes neuronais, que usam camadas convolucionais adaptadas a grafos e operações de aglomeração de nodos que extraem características moleculares dos grafos. O objetivo principal é garantir que todos os modelos generalizam bem para obter bons resultados em novas experiências com moléculas desconhecidas. Realizámos testes em dados químicos para ambos os métodos e alcançamos melhorias. A não-linearidade nos graph kernels mostrou-se a mais vantajosa, tendo superado os métodos do estado-da-arte em um dos dois testes globais realizados. As redes neuronais de grafos não foram tão eficazes, embora tenham apresentado resultados competitivos. Ainda no que diz respeito às redes neuronais, destacamos a criação da base de deep learning e a análise aprofundada dos hiperparâmetros como fundamentação para as pesquisas futuras no problema de previsão de rendimento de reações químicas, uma vez que esta área apresenta muito potencial na descoberta de medicamentos.Analide, CesarUniversidade do MinhoBraga, Diogo Filipe Ribeiro Ferreira2022-04-012022-04-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/86736eng203361849info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-10-14T01:20:56Zoai:repositorium.sdum.uminho.pt:1822/86736Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:35:27.023412Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Graph kernels and neural networks for predicting yields of chemical reactions
title Graph kernels and neural networks for predicting yields of chemical reactions
spellingShingle Graph kernels and neural networks for predicting yields of chemical reactions
Braga, Diogo Filipe Ribeiro Ferreira
Machine learning
Chemistry
Graphs
Kernel methods
Graph neural networks
Química
Grafos
Redes neuronais de grafos
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Graph kernels and neural networks for predicting yields of chemical reactions
title_full Graph kernels and neural networks for predicting yields of chemical reactions
title_fullStr Graph kernels and neural networks for predicting yields of chemical reactions
title_full_unstemmed Graph kernels and neural networks for predicting yields of chemical reactions
title_sort Graph kernels and neural networks for predicting yields of chemical reactions
author Braga, Diogo Filipe Ribeiro Ferreira
author_facet Braga, Diogo Filipe Ribeiro Ferreira
author_role author
dc.contributor.none.fl_str_mv Analide, Cesar
Universidade do Minho
dc.contributor.author.fl_str_mv Braga, Diogo Filipe Ribeiro Ferreira
dc.subject.por.fl_str_mv Machine learning
Chemistry
Graphs
Kernel methods
Graph neural networks
Química
Grafos
Redes neuronais de grafos
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Machine learning
Chemistry
Graphs
Kernel methods
Graph neural networks
Química
Grafos
Redes neuronais de grafos
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado em Informatics Engineering
publishDate 2022
dc.date.none.fl_str_mv 2022-04-01
2022-04-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/86736
url https://hdl.handle.net/1822/86736
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203361849
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133617308303360