Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes

Detalhes bibliográficos
Autor(a) principal: Carregosa, Felipe Borda
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/13068
Resumo: Deep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures.
id UFRJ_a3099795e97eb41e129fc21a5e0e27b9
oai_identifier_str oai:pantheon.ufrj.br:11422/13068
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentesRedes Neurais RecorrentesIndução Neural de ProgramasMáquina Virtual DiferenciávelCNPQ::ENGENHARIASDeep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures.Nos últimos anos, novas técnicas em redes neurais produziram excepcionais resultados em diversos domínios. Produzir redes neurais em que se é possível observar a lógica por trás de seu processo de decisão ainda é muito difícil, especialmente quando se deseja que também tenha desempenho competitivo com os modelos já existentes. Um passo nessa direção é o desenvolvimento recente dos programadores neurais. Nesta dissertação, propõe-se um programador neural comparativamente simples, com uma máquina virtual diferenciável bastante extensível, que pode ser facilmente integrada em arquiteturas de redes neurais de múltiplas camadas existentes, fornecendo módulos com um raciocínio mais transparente aos modelos atuais. Permite-se também adicionar a capacidade de se aprender a produzir e executar algoritmos com as mesmas ferramentas para treino e execução das redes neurais. Os testes realizados com a rede proposta sugerem que ela tem o potencial de induzir algoritmos, mesmo sem qualquer tipo de otimização especial, com resultados competitivos com as atuais arquiteturas de redes neurais recorrentes.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJZaverucha, Gersonhttp://lattes.cnpq.br/5117568495536090http://lattes.cnpq.br/6078715848476230Carvalho, Aline Marins Paeshttp://lattes.cnpq.br/0506389215528790Barbosa, Valmir CarneiroVellasco, Marley Maria Bernardes RebuzziCarregosa, Felipe Borda2020-09-21T21:16:57Z2023-12-21T03:02:17Z2018-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13068porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:17Zoai:pantheon.ufrj.br:11422/13068Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:17Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.none.fl_str_mv Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
title Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
spellingShingle Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
Carregosa, Felipe Borda
Redes Neurais Recorrentes
Indução Neural de Programas
Máquina Virtual Diferenciável
CNPQ::ENGENHARIAS
title_short Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
title_full Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
title_fullStr Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
title_full_unstemmed Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
title_sort Implementando uma máquina virtual diferenciável mínima em redes neurais recorrentes
author Carregosa, Felipe Borda
author_facet Carregosa, Felipe Borda
author_role author
dc.contributor.none.fl_str_mv Zaverucha, Gerson
http://lattes.cnpq.br/5117568495536090
http://lattes.cnpq.br/6078715848476230
Carvalho, Aline Marins Paes
http://lattes.cnpq.br/0506389215528790
Barbosa, Valmir Carneiro
Vellasco, Marley Maria Bernardes Rebuzzi
dc.contributor.author.fl_str_mv Carregosa, Felipe Borda
dc.subject.por.fl_str_mv Redes Neurais Recorrentes
Indução Neural de Programas
Máquina Virtual Diferenciável
CNPQ::ENGENHARIAS
topic Redes Neurais Recorrentes
Indução Neural de Programas
Máquina Virtual Diferenciável
CNPQ::ENGENHARIAS
description Deep Learning techniques have achieved impressive results in many domains over the last few years. However, it’s still difficult to produce understandable models that clearly show the embedded logic behind the decision process while still having competitive performance. One step in this direction is the recent development of neural programmers. In this work, it’s proposed a very simple neural programmer with an extensible differentiable virtual machine that can be easily integrated in existing deep learning architectures, providing modules with more transparent reasoning to current models. At the same time it enables neural networks to learn to write and execute algorithm within the same training environment. Tests conducted with the proposed network suggests that it has the potential to induce algorithms even without any kind of special optimization and being competitive with current recurrent neural networks architectures.
publishDate 2018
dc.date.none.fl_str_mv 2018-03
2020-09-21T21:16:57Z
2023-12-21T03:02:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/13068
url http://hdl.handle.net/11422/13068
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv pantheon@sibi.ufrj.br
_version_ 1815456010129637376