Aprendizado e controle de robôs móveis autônomos utilizando atenção visual

Bibliographic Details
Main Author: Heinen, Milton Roberto
Publication Date: 2010
Other Authors: Engel, Paulo Martins
Format: Article
Language: por
Source: Repositório Institucional da UFRGS
Download full: http://hdl.handle.net/10183/226155
Summary: Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais.
id UFRGS-2_b6027fe096ac0771fb1f9cbc54fdb87a
oai_identifier_str oai:www.lume.ufrgs.br:10183/226155
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Heinen, Milton RobertoEngel, Paulo Martins2021-08-26T04:08:59Z20100103-4308http://hdl.handle.net/10183/226155000852775Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais.This paper describes a reinforcement learning model which is able to learn complex control tasks using continuous states and actions. This model, which is based on continuous actor-critic model, uses normalized radial basis function networks to learn the value function of states and actions, and is able to configure the network structure in an automatic way during the learning process. Besides, a visual selective attention mechanism is used to perceive the environment and the states. To validate the proposed model, a relatively complex task for reinforcement learning algorithms was used: to guide a ball to the goal in a robot soccer simulated environment. The described experiments shows that the proposed model is able to accomplish the task in a very successful way using visual information only.application/pdfporRevista de informática teórica e aplicada. Porto Alegre. Vol. 17, n. 3 (2010), p. 349-363Inteligência artificialAprendizagem : MaquinaRobóticaAprendizado e controle de robôs móveis autônomos utilizando atenção visualinfo:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000852775.pdf.txt000852775.pdf.txtExtracted Texttext/plain41557http://www.lume.ufrgs.br/bitstream/10183/226155/2/000852775.pdf.txt78ffa513204fc9a4ca912b060f31b4d7MD52ORIGINAL000852775.pdfTexto completoapplication/pdf2154467http://www.lume.ufrgs.br/bitstream/10183/226155/1/000852775.pdfa74ab593bb34cfb8d740df0c92ec3c1dMD5110183/2261552021-09-19 04:30:16.641696oai:www.lume.ufrgs.br:10183/226155Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-09-19T07:30:16Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
title Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
spellingShingle Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
Heinen, Milton Roberto
Inteligência artificial
Aprendizagem : Maquina
Robótica
title_short Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
title_full Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
title_fullStr Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
title_full_unstemmed Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
title_sort Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
author Heinen, Milton Roberto
author_facet Heinen, Milton Roberto
Engel, Paulo Martins
author_role author
author2 Engel, Paulo Martins
author2_role author
dc.contributor.author.fl_str_mv Heinen, Milton Roberto
Engel, Paulo Martins
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizagem : Maquina
Robótica
topic Inteligência artificial
Aprendizagem : Maquina
Robótica
description Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2021-08-26T04:08:59Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/other
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/226155
dc.identifier.issn.pt_BR.fl_str_mv 0103-4308
dc.identifier.nrb.pt_BR.fl_str_mv 000852775
identifier_str_mv 0103-4308
000852775
url http://hdl.handle.net/10183/226155
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Revista de informática teórica e aplicada. Porto Alegre. Vol. 17, n. 3 (2010), p. 349-363
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/226155/2/000852775.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/226155/1/000852775.pdf
bitstream.checksum.fl_str_mv 78ffa513204fc9a4ca912b060f31b4d7
a74ab593bb34cfb8d740df0c92ec3c1d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1798487487718359040