Graph kernels and neural networks for predicting yields of chemical reactions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/86736 |
Resumo: | Dissertação de mestrado em Informatics Engineering |
id |
RCAP_ede2f815a83bdad128a0135119ffcf7d |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/86736 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Graph kernels and neural networks for predicting yields of chemical reactionsMachine learningChemistryGraphsKernel methodsGraph neural networksQuímicaGrafosRedes neuronais de grafosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em Informatics EngineeringPredicting chemical reaction yields is a widely investigated problem in drug discovery due to the natu ral appearance of diseases and viruses worldwide. With the evolution and further study of machine learn ing, this area of computer science has provided alternatives that help chemists search for more effective molecule combinations. This dissertation presents two research hypotheses with different bases that seek to improve this prediction problem. The first research hypothesis is related to the support vector regression algorithm, which uses graph kernels to measure similarity between molecules and then perform the pre diction. We propose the application of non-linearity in the Weisfeiler-Lehman graph kernel to improve the measure of comparison between molecules and thus enhance the complexity of the support vector regres sion models. The second research hypothesis is related to the class of neural networks. We propose a deep learning base to solve this problem through graph neural networks, which use graph convolutional layers and global read-out operations to extract molecular features from graph-structure data. The main focus is to ensure that all models generalise well to obtain good results in experiments with unknown molecules. We performed tests on chemical data for both methods and achieved improvements. The non-linearity in graph kernels proved to be the most advantageous, having surpassed the state-of-the-art methods in one of the two global tests performed. The graph neural networks were not as effective, although they showed competitive results. Concerning neural networks, we highlight the creation of the deep learning base and the in-depth analysis of the hyperparameters to enhance further research on the reaction yield prediction problem, as this area shows immense potential in drug discovery.A previsão do rendimento de reações químicas é um problema amplamente investigado na descoberta de medicamentos devido ao aparecimento natural de doenças e vírus em todo o mundo. Com a evolução e o estudo do machine learning, esta área da ciência da computação tem oferecido alternativas que ajudam os químicos a encontrar combinações de moléculas mais eficazes. Esta dissertação apresenta duas hipóteses de pesquisa com bases distintas que procuram melhorar este problema de previsão. A primeira hipótese de pesquisa está relacionada com o algoritmo support vector regression, que usa graph kernels para medir a similaridade entre as moléculas e, em seguida, realizar a previsão. Propomos a aplicação da não-linearidade no Weisfeiler-Lehman graph kernel para melhorar a medida de comparação entre moléculas e, assim, aumentar a complexidade dos modelos support vector regression. A segunda hipótese de pesquisa está relacionada com as redes neuronais. Propomos uma base de deep learning para resolver este problema através de redes neuronais, que usam camadas convolucionais adaptadas a grafos e operações de aglomeração de nodos que extraem características moleculares dos grafos. O objetivo principal é garantir que todos os modelos generalizam bem para obter bons resultados em novas experiências com moléculas desconhecidas. Realizámos testes em dados químicos para ambos os métodos e alcançamos melhorias. A não-linearidade nos graph kernels mostrou-se a mais vantajosa, tendo superado os métodos do estado-da-arte em um dos dois testes globais realizados. As redes neuronais de grafos não foram tão eficazes, embora tenham apresentado resultados competitivos. Ainda no que diz respeito às redes neuronais, destacamos a criação da base de deep learning e a análise aprofundada dos hiperparâmetros como fundamentação para as pesquisas futuras no problema de previsão de rendimento de reações químicas, uma vez que esta área apresenta muito potencial na descoberta de medicamentos.Analide, CesarUniversidade do MinhoBraga, Diogo Filipe Ribeiro Ferreira2022-04-012022-04-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/86736eng203361849info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-10-14T01:20:56Zoai:repositorium.sdum.uminho.pt:1822/86736Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:35:27.023412Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Graph kernels and neural networks for predicting yields of chemical reactions |
title |
Graph kernels and neural networks for predicting yields of chemical reactions |
spellingShingle |
Graph kernels and neural networks for predicting yields of chemical reactions Braga, Diogo Filipe Ribeiro Ferreira Machine learning Chemistry Graphs Kernel methods Graph neural networks Química Grafos Redes neuronais de grafos Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Graph kernels and neural networks for predicting yields of chemical reactions |
title_full |
Graph kernels and neural networks for predicting yields of chemical reactions |
title_fullStr |
Graph kernels and neural networks for predicting yields of chemical reactions |
title_full_unstemmed |
Graph kernels and neural networks for predicting yields of chemical reactions |
title_sort |
Graph kernels and neural networks for predicting yields of chemical reactions |
author |
Braga, Diogo Filipe Ribeiro Ferreira |
author_facet |
Braga, Diogo Filipe Ribeiro Ferreira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Analide, Cesar Universidade do Minho |
dc.contributor.author.fl_str_mv |
Braga, Diogo Filipe Ribeiro Ferreira |
dc.subject.por.fl_str_mv |
Machine learning Chemistry Graphs Kernel methods Graph neural networks Química Grafos Redes neuronais de grafos Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Machine learning Chemistry Graphs Kernel methods Graph neural networks Química Grafos Redes neuronais de grafos Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
Dissertação de mestrado em Informatics Engineering |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-04-01 2022-04-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/86736 |
url |
https://hdl.handle.net/1822/86736 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
203361849 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133617308303360 |