Aprendizado e controle de robôs móveis autônomos utilizando atenção visual
Main Author: | |
---|---|
Publication Date: | 2010 |
Other Authors: | |
Format: | Article |
Language: | por |
Source: | Repositório Institucional da UFRGS |
Download full: | http://hdl.handle.net/10183/226155 |
Summary: | Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais. |
id |
UFRGS-2_b6027fe096ac0771fb1f9cbc54fdb87a |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/226155 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Heinen, Milton RobertoEngel, Paulo Martins2021-08-26T04:08:59Z20100103-4308http://hdl.handle.net/10183/226155000852775Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais.This paper describes a reinforcement learning model which is able to learn complex control tasks using continuous states and actions. This model, which is based on continuous actor-critic model, uses normalized radial basis function networks to learn the value function of states and actions, and is able to configure the network structure in an automatic way during the learning process. Besides, a visual selective attention mechanism is used to perceive the environment and the states. To validate the proposed model, a relatively complex task for reinforcement learning algorithms was used: to guide a ball to the goal in a robot soccer simulated environment. The described experiments shows that the proposed model is able to accomplish the task in a very successful way using visual information only.application/pdfporRevista de informática teórica e aplicada. Porto Alegre. Vol. 17, n. 3 (2010), p. 349-363Inteligência artificialAprendizagem : MaquinaRobóticaAprendizado e controle de robôs móveis autônomos utilizando atenção visualinfo:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000852775.pdf.txt000852775.pdf.txtExtracted Texttext/plain41557http://www.lume.ufrgs.br/bitstream/10183/226155/2/000852775.pdf.txt78ffa513204fc9a4ca912b060f31b4d7MD52ORIGINAL000852775.pdfTexto completoapplication/pdf2154467http://www.lume.ufrgs.br/bitstream/10183/226155/1/000852775.pdfa74ab593bb34cfb8d740df0c92ec3c1dMD5110183/2261552021-09-19 04:30:16.641696oai:www.lume.ufrgs.br:10183/226155Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-09-19T07:30:16Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
title |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
spellingShingle |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual Heinen, Milton Roberto Inteligência artificial Aprendizagem : Maquina Robótica |
title_short |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
title_full |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
title_fullStr |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
title_full_unstemmed |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
title_sort |
Aprendizado e controle de robôs móveis autônomos utilizando atenção visual |
author |
Heinen, Milton Roberto |
author_facet |
Heinen, Milton Roberto Engel, Paulo Martins |
author_role |
author |
author2 |
Engel, Paulo Martins |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Heinen, Milton Roberto Engel, Paulo Martins |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizagem : Maquina Robótica |
topic |
Inteligência artificial Aprendizagem : Maquina Robótica |
description |
Este artigo descreve um modelo de aprendizado por reforço capaz de aprender tarefas de controle complexas utilizando ações e estados contínuos. Este modelo, que é baseado no ator-crítico contínuo, utiliza redes de funções de base radial normalizadas para aprender o valor dos estados e das ações, sendo capaz de configurar a estrutura destas redes de forma automática durante o aprendizado. Além disso, um mecanismo de atenção visual seletiva é utilizado para perceber o ambiente e os estados. Para a validação do modelo proposto, foi utilizada uma tarefa relativamente complexa para os algoritmos de aprendizado por reforço: conduzir uma bola até o gol em um ambiente de futebol de robôs simulado. Os experimentos realizados demonstram que o modelo proposto é capaz realizar a tarefa em questão com bastante sucesso utilizando somente informações visuais. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010 |
dc.date.accessioned.fl_str_mv |
2021-08-26T04:08:59Z |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/other |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/226155 |
dc.identifier.issn.pt_BR.fl_str_mv |
0103-4308 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000852775 |
identifier_str_mv |
0103-4308 000852775 |
url |
http://hdl.handle.net/10183/226155 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.ispartof.pt_BR.fl_str_mv |
Revista de informática teórica e aplicada. Porto Alegre. Vol. 17, n. 3 (2010), p. 349-363 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/226155/2/000852775.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/226155/1/000852775.pdf |
bitstream.checksum.fl_str_mv |
78ffa513204fc9a4ca912b060f31b4d7 a74ab593bb34cfb8d740df0c92ec3c1d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1798487487718359040 |