Learning to solve NP-complete problems
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/199216 |
Resumo: | Graph Neural Networks (GNN) constituem uma técnica promisora para conectar programação diferencial e domínios combinatoriais. GNNs lançam mão de módulos treináveis os quais podem ser montados em diferentes configurações, cada uma refletindo a estrutura relacional de uma instância específica. Nessa tese, nós propomos uma nova formulação para GNNs, a qual faz uso do conceito de “tipos” para particionar os objetos no domínio do problema em múltiplas classes distintas, resultando no modelo das Typed Graph Networks (TGN) e numa biblioteca Python / Tensorflow para prototipar TGNs. Esta tese também se preocupa com a aplicação de GNNs no Problema do Caixeiro(a) Viajante (PCV). Nós mostramos que GNNs são capazes de aprender a resolver, com pouquíssima supervisão, a variante de decisão do PCV, um problema NP-Completo altamente relevante. Nosso modelo é treinado para funcionar, efetivamente, como um algoritmo de troca de mensagens em grafos no qual as arestas do grafo de entrada comunicam-se com os vértices do grafo de entrada por um determinado número de iterações, depois do qual o modelo é forçado a responder se o grafo de entrada admite ou não uma rota Hamiltoniana de custo < C 2 R+ 0 . Nós mostramos que esta rede pode ser treinada com conjuntos de exemplos duais: dado o custo ótimo C , produzimos uma instância de decisão com custo alvo (C) x% menor e uma com custo alvo x% maior do que C . Nós fomos capazes de obter 80% de acurácia treinando o modelo com desvios de −2%,+2%, e o mesmo modelo treinado foi capaz de generalizar para desvios mais relaxados com melhor performance. Também mostramos que o modelo é capaz de generalizar para problemas maiores. Finalmente, nós oferecemos um método para predizer o custo de rota ótimo dentro de 1.5% de desvio relativo para o valor real. Em resumo, nosso trabalho demonstra que GNNs são suficientemente poderosas para resolver problems NP-Completos que combinam dados simbólicos e numéricos, além de propor uma reformulação moderna do meta-modelo. |
id |
URGS_fb27ff17566c735deb027b82eedd3a22 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/199216 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Prates, Marcelo de Oliveira RosaLamb, Luis da Cunha2019-09-13T03:49:14Z2019http://hdl.handle.net/10183/199216001100446Graph Neural Networks (GNN) constituem uma técnica promisora para conectar programação diferencial e domínios combinatoriais. GNNs lançam mão de módulos treináveis os quais podem ser montados em diferentes configurações, cada uma refletindo a estrutura relacional de uma instância específica. Nessa tese, nós propomos uma nova formulação para GNNs, a qual faz uso do conceito de “tipos” para particionar os objetos no domínio do problema em múltiplas classes distintas, resultando no modelo das Typed Graph Networks (TGN) e numa biblioteca Python / Tensorflow para prototipar TGNs. Esta tese também se preocupa com a aplicação de GNNs no Problema do Caixeiro(a) Viajante (PCV). Nós mostramos que GNNs são capazes de aprender a resolver, com pouquíssima supervisão, a variante de decisão do PCV, um problema NP-Completo altamente relevante. Nosso modelo é treinado para funcionar, efetivamente, como um algoritmo de troca de mensagens em grafos no qual as arestas do grafo de entrada comunicam-se com os vértices do grafo de entrada por um determinado número de iterações, depois do qual o modelo é forçado a responder se o grafo de entrada admite ou não uma rota Hamiltoniana de custo < C 2 R+ 0 . Nós mostramos que esta rede pode ser treinada com conjuntos de exemplos duais: dado o custo ótimo C , produzimos uma instância de decisão com custo alvo (C) x% menor e uma com custo alvo x% maior do que C . Nós fomos capazes de obter 80% de acurácia treinando o modelo com desvios de −2%,+2%, e o mesmo modelo treinado foi capaz de generalizar para desvios mais relaxados com melhor performance. Também mostramos que o modelo é capaz de generalizar para problemas maiores. Finalmente, nós oferecemos um método para predizer o custo de rota ótimo dentro de 1.5% de desvio relativo para o valor real. Em resumo, nosso trabalho demonstra que GNNs são suficientemente poderosas para resolver problems NP-Completos que combinam dados simbólicos e numéricos, além de propor uma reformulação moderna do meta-modelo.Graph Neural Networks (GNN) are a promising technique for bridging differential programming and combinatorial domains. GNNs employ trainable modules which can be assembled in different configurations that reflect the relational structure of each problem instance. In this thesis, we propose a new formulation for GNNs, which employs the concept of “types” to partition the objects in the problem domain into many distinct classes, yielding the Typed Graph Networks (TGN) model and a Python / Tensorflow library for prototyping TGNs. This thesis is also concerned with the application of GNNs to the Traveling Salesperson Problem (TSP). We show that GNNs can learn to solve, with very little supervision, the decision variant of the TSP, a highly relevant NP-Complete problem. Our model is trained to function as an effective message-passing algorithm in graph in which edges from the input graph communicate with vertices from the input graph for a number of iterations after which the model is asked to decide whether a route with cost < C 2 R+ 0 exists. We show that such a network can be trained with sets of dual examples: given the optimal tour cost C , we produce one decision instance with target cost (C) x% smaller and one with target cost x% larger than C . We were able to obtain 80% accuracy training with −2%,+2% deviations, and the same trained model can generalize for more relaxed deviations with increasing performance. We also show that the model is capable of generalizing for larger problem sizes. Finally, we provide a method for predicting the optimal route cost within 1.5% relative deviation from the ground truth. In summary, our work shows that Graph Neural Networks are powerful enough to solve NP-Complete problems which combine symbolic and numeric data, in addition to proposing a modern reformulation of the meta-model.application/pdfengInteligência artificialRedes neuraisArtificial Neural NetworkDeep LearningGraph Neural NetworkLearning to solve NP-complete problemsAprendendo a resolver problemas NP-completos info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001100446.pdf.txt001100446.pdf.txtExtracted Texttext/plain287834http://www.lume.ufrgs.br/bitstream/10183/199216/2/001100446.pdf.txtb89438bae6910d6a1894b7a32d9cd247MD52ORIGINAL001100446.pdfTexto completo (inglês)application/pdf4374804http://www.lume.ufrgs.br/bitstream/10183/199216/1/001100446.pdfcffbe4233a5a2583d8654074238a4ba7MD5110183/1992162021-05-26 04:34:10.549156oai:www.lume.ufrgs.br:10183/199216Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:34:10Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Learning to solve NP-complete problems |
dc.title.alternative.pt.fl_str_mv |
Aprendendo a resolver problemas NP-completos |
title |
Learning to solve NP-complete problems |
spellingShingle |
Learning to solve NP-complete problems Prates, Marcelo de Oliveira Rosa Inteligência artificial Redes neurais Artificial Neural Network Deep Learning Graph Neural Network |
title_short |
Learning to solve NP-complete problems |
title_full |
Learning to solve NP-complete problems |
title_fullStr |
Learning to solve NP-complete problems |
title_full_unstemmed |
Learning to solve NP-complete problems |
title_sort |
Learning to solve NP-complete problems |
author |
Prates, Marcelo de Oliveira Rosa |
author_facet |
Prates, Marcelo de Oliveira Rosa |
author_role |
author |
dc.contributor.author.fl_str_mv |
Prates, Marcelo de Oliveira Rosa |
dc.contributor.advisor1.fl_str_mv |
Lamb, Luis da Cunha |
contributor_str_mv |
Lamb, Luis da Cunha |
dc.subject.por.fl_str_mv |
Inteligência artificial Redes neurais |
topic |
Inteligência artificial Redes neurais Artificial Neural Network Deep Learning Graph Neural Network |
dc.subject.eng.fl_str_mv |
Artificial Neural Network Deep Learning Graph Neural Network |
description |
Graph Neural Networks (GNN) constituem uma técnica promisora para conectar programação diferencial e domínios combinatoriais. GNNs lançam mão de módulos treináveis os quais podem ser montados em diferentes configurações, cada uma refletindo a estrutura relacional de uma instância específica. Nessa tese, nós propomos uma nova formulação para GNNs, a qual faz uso do conceito de “tipos” para particionar os objetos no domínio do problema em múltiplas classes distintas, resultando no modelo das Typed Graph Networks (TGN) e numa biblioteca Python / Tensorflow para prototipar TGNs. Esta tese também se preocupa com a aplicação de GNNs no Problema do Caixeiro(a) Viajante (PCV). Nós mostramos que GNNs são capazes de aprender a resolver, com pouquíssima supervisão, a variante de decisão do PCV, um problema NP-Completo altamente relevante. Nosso modelo é treinado para funcionar, efetivamente, como um algoritmo de troca de mensagens em grafos no qual as arestas do grafo de entrada comunicam-se com os vértices do grafo de entrada por um determinado número de iterações, depois do qual o modelo é forçado a responder se o grafo de entrada admite ou não uma rota Hamiltoniana de custo < C 2 R+ 0 . Nós mostramos que esta rede pode ser treinada com conjuntos de exemplos duais: dado o custo ótimo C , produzimos uma instância de decisão com custo alvo (C) x% menor e uma com custo alvo x% maior do que C . Nós fomos capazes de obter 80% de acurácia treinando o modelo com desvios de −2%,+2%, e o mesmo modelo treinado foi capaz de generalizar para desvios mais relaxados com melhor performance. Também mostramos que o modelo é capaz de generalizar para problemas maiores. Finalmente, nós oferecemos um método para predizer o custo de rota ótimo dentro de 1.5% de desvio relativo para o valor real. Em resumo, nosso trabalho demonstra que GNNs são suficientemente poderosas para resolver problems NP-Completos que combinam dados simbólicos e numéricos, além de propor uma reformulação moderna do meta-modelo. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-09-13T03:49:14Z |
dc.date.issued.fl_str_mv |
2019 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/199216 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001100446 |
url |
http://hdl.handle.net/10183/199216 |
identifier_str_mv |
001100446 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/199216/2/001100446.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/199216/1/001100446.pdf |
bitstream.checksum.fl_str_mv |
b89438bae6910d6a1894b7a32d9cd247 cffbe4233a5a2583d8654074238a4ba7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800309153449639936 |