Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/13068 |
Resumo: | Deep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures. |
id |
UFRJ_a3099795e97eb41e129fc21a5e0e27b9 |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/13068 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentesRedes Neurais RecorrentesIndução Neural de ProgramasMáquina Virtual DiferenciávelCNPQ::ENGENHARIASDeep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures.Nos últimos anos, novas técnicas em redes neurais produziram excepcionais resultados em diversos domínios. Produzir redes neurais em que se é possível observar a lógica por trás de seu processo de decisão ainda é muito difícil, especialmente quando se deseja que também tenha desempenho competitivo com os modelos já existentes. Um passo nessa direção é o desenvolvimento recente dos programadores neurais. Nesta dissertação, propõe-se um programador neural comparativamente simples, com uma máquina virtual diferenciável bastante extensível, que pode ser facilmente integrada em arquiteturas de redes neurais de múltiplas camadas existentes, fornecendo módulos com um raciocínio mais transparente aos modelos atuais. Permite-se também adicionar a capacidade de se aprender a produzir e executar algoritmos com as mesmas ferramentas para treino e execução das redes neurais. Os testes realizados com a rede proposta sugerem que ela tem o potencial de induzir algoritmos, mesmo sem qualquer tipo de otimização especial, com resultados competitivos com as atuais arquiteturas de redes neurais recorrentes.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJZaverucha, Gersonhttp://lattes.cnpq.br/5117568495536090http://lattes.cnpq.br/6078715848476230Carvalho, Aline Marins Paeshttp://lattes.cnpq.br/0506389215528790Barbosa, Valmir CarneiroVellasco, Marley Maria Bernardes RebuzziCarregosa, Felipe Borda2020-09-21T21:16:57Z2023-12-21T03:02:17Z2018-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13068porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:17Zoai:pantheon.ufrj.br:11422/13068Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:17Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
title |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
spellingShingle |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes Carregosa, Felipe Borda Redes Neurais Recorrentes Indução Neural de Programas Máquina Virtual Diferenciável CNPQ::ENGENHARIAS |
title_short |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
title_full |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
title_fullStr |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
title_full_unstemmed |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
title_sort |
Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes |
author |
Carregosa, Felipe Borda |
author_facet |
Carregosa, Felipe Borda |
author_role |
author |
dc.contributor.none.fl_str_mv |
Zaverucha, Gerson http://lattes.cnpq.br/5117568495536090 http://lattes.cnpq.br/6078715848476230 Carvalho, Aline Marins Paes http://lattes.cnpq.br/0506389215528790 Barbosa, Valmir Carneiro Vellasco, Marley Maria Bernardes Rebuzzi |
dc.contributor.author.fl_str_mv |
Carregosa, Felipe Borda |
dc.subject.por.fl_str_mv |
Redes Neurais Recorrentes Indução Neural de Programas Máquina Virtual Diferenciável CNPQ::ENGENHARIAS |
topic |
Redes Neurais Recorrentes Indução Neural de Programas Máquina Virtual Diferenciável CNPQ::ENGENHARIAS |
description |
Deep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-03 2020-09-21T21:16:57Z 2023-12-21T03:02:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/13068 |
url |
http://hdl.handle.net/11422/13068 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815456010129637376 |