Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery

Detalhes bibliográficos
Autor(a) principal: Torres, Luís Henrique Magalhães Ramos
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/92189
Resumo: Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia
id RCAP_a796ff3643abe0f4aaaa72a9da44aa1b
oai_identifier_str oai:estudogeral.uc.pt:10316/92189
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Exploring a Siamese Neural Network Architecture for One-Shot Drug DiscoveryExploring a Siamese Neural Network Architecture for One-Shot Drug DiscoveryRedes Neuronais SiameseRedes Neuronais ConvolucionaisDescoberta de FármacosAprendizagem ProfundaOne-Shot LearningDrug DiscoveryDeep LearningOne-Shot LearningSiamese Neural NetworkConvolutional Neural NetworkTrabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e TecnologiaAs redes neuronais profundas oferecem um elevado poder preditivo ao ser capazes de inferir as propriedades farmacológicas e atividades biológicas de pequenas moléculas em aplicações para descoberta de fármacos. No entanto, a quantidade de informação supervisionada disponível para treino é escassa e o passo de 'lead-optimization' apresenta um problema de 'low-data', dificultando a descoberta de novos compostos com a atividade terapêutica pretendida e respetivos análogos farmacológicos. Um requisito fundamental é a necessidade de uma grande quantidade de exemplos de treino por classe, o que nem sempre é possível em aplicações para descoberta de fármacos. Estes desafios invalidam o uso de instâncias cujas classes são desconhecidas no treino ou em dados onde o número de classes é elevado e oscila dinamicamente. O grande objetivo deste estudo é otimizar a descoberta de novos compostos partindo de um conjunto reduzido de moléculas candidatas. Assim, propomos uma arquitetura de redes neuronais paralelas implementando uma estratégia de 'one-shot learning', baseada num conjunto de redes neuronais convolucionais (CNNs) capazes de aprender a partir de um dado 'score' de semelhança entre duas moléculas devolvido por uma dada função de similaridade. Aplicando uma estratégia de 'one-shot learning', apenas necessitamos de um reduzido conjunto de instâncias por classe para treino e de um pequeno conjunto de dados e recursos computacionais para a construção de um modelo eficaz na previsão. Os resultados obtidos demonstram que o uso de um conjunto de redes neuronais convolucionais paralelas implementando uma estratégia de 'one-shot learning' conduz à obtenção de desempenhos superiores na previsão de novos compostos comparando com os modelos 'state-of-the-art'. Assim, o modelo proposto permite prever corretamente e com elevada eficácia, novos compostos e respetivos análogos farmacológicos, considerando a escassez de dados biológicos disponíveis para aplicações de descoberta e desenvolvimento de fármacos.Deep neural networks offer a great predictive power when inferring the pharmacological properties and biological activities of small molecules in drug discovery applications. However, in the traditional drug discovery process, where supervised data is scarce, the lead-optimization step is a low-data problem, making it difficult to find molecules with the desired therapeutic activity and obtain accurate predictions for novel compounds and their pharmacological analogs. One major requirement to ensure the validity of the obtained neural network models is the need for a large number of training examples per class, which is not always feasible in drug discovery applications. This invalidates the use of instances whose classes were not considered in the training phase or in data where the number of classes is high and oscillates dynamically.The main objective of the study is to optimize the discovery of novel compounds based on a reduced set of candidate drugs. We propose a Siamese neural network architecture for one-shot classification, based on Convolutional Neural Networks (CNNs), that learns from a similarity score between two input molecules according to a given similarity function. Using a one-shot learning strategy, few instances per class are needed for training, and a small amount of data and computational resources are required to build an accurate model. The results achieved demonstrate that using a Siamese Deep Neural Network for one-shot classification leads to overall improved performance when compared to other state-of-the-art models. The proposed one-shot Siamese neural network architecture provides an accurate and reliable prediction of novel compounds considering the lack of biological data available for drug discovery tasks.Outro - This research has been funded by the Portuguese Research Agency FCT, through D4 - Deep Drug Discovery and Deployment(CENTRO-01-0145-FEDER-029266).2020-09-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92189http://hdl.handle.net/10316/92189TID:202554546engTorres, Luís Henrique Magalhães Ramosinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:26:58Zoai:estudogeral.uc.pt:10316/92189Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:21.133102Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
title Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
spellingShingle Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
Torres, Luís Henrique Magalhães Ramos
Redes Neuronais Siamese
Redes Neuronais Convolucionais
Descoberta de Fármacos
Aprendizagem Profunda
One-Shot Learning
Drug Discovery
Deep Learning
One-Shot Learning
Siamese Neural Network
Convolutional Neural Network
title_short Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
title_full Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
title_fullStr Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
title_full_unstemmed Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
title_sort Exploring a Siamese Neural Network Architecture for One-Shot Drug Discovery
author Torres, Luís Henrique Magalhães Ramos
author_facet Torres, Luís Henrique Magalhães Ramos
author_role author
dc.contributor.author.fl_str_mv Torres, Luís Henrique Magalhães Ramos
dc.subject.por.fl_str_mv Redes Neuronais Siamese
Redes Neuronais Convolucionais
Descoberta de Fármacos
Aprendizagem Profunda
One-Shot Learning
Drug Discovery
Deep Learning
One-Shot Learning
Siamese Neural Network
Convolutional Neural Network
topic Redes Neuronais Siamese
Redes Neuronais Convolucionais
Descoberta de Fármacos
Aprendizagem Profunda
One-Shot Learning
Drug Discovery
Deep Learning
One-Shot Learning
Siamese Neural Network
Convolutional Neural Network
description Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia
publishDate 2020
dc.date.none.fl_str_mv 2020-09-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/92189
http://hdl.handle.net/10316/92189
TID:202554546
url http://hdl.handle.net/10316/92189
identifier_str_mv TID:202554546
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134010197147648