Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado

Celiberto Jr., L. A.

Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado

Detalhes bibliográficos
Autor(a) principal:	Celiberto Jr., L. A.
Data de Publicação:	2007
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo:	https://repositorio.fei.edu.br/handle/FEI/437
Resumo:	O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porém, esta técnica não é eficiente o bastante para ser usada em aplicações com exigências do mundo real, devido ao tempo que o agente leva para aprender. Este trabalho apresenta o uso do Aprendizado por Reforço acelerado por heurísticas, no domínio da robótica móvel, utilizando para testes a plataforma do Robocup 2D simulação. Esta plataforma vem sendo usada cada dia mais no meio científico, a qual possiblita fazer inúmeros experimentos com jogadores virtuais, sem sofrer com problemas que comumente são encontrados em sistemas reais, além de manterem sempre as mesmas características de ambiente. O principal problema abordado neste trabalho é o uso da aceleração por heurísticas no Aprendizado por Reforço. Porém esta aceleração só é possível se primeiro for resolvido o problema de como desenvolver um sistema com Aprendizado por Reforço no Robocup 2D. Tal sistema apresenta diversos desafios, sendo o maior deles o tamanho do ambiente, o que gera grande dificuldade para um agente aprender uma política de decisões. Para solucionar este problema forma propostas formas de generalizar os estados, sem causar qualquer interferência no aprendizado. As experiências realizadas foram feitas sem o uso das heurísticas e depois com o uso das heurísticas. para a validação do trabalho, cada experimento foi repetido dez vezes, e seus resultados médios comparados através de uma análise estatística. Os resultados indicam algumas vantagens no uso das heurísticas, possibilitando a definição de algumas diretrizes importantes para a aplicação do uso de heurísticas no domínio do futebol de robôs simulado.

Metadados do item

id	FEI_4c1458db862b525b5c176368cd1896fd
oai_identifier_str	oai:repositorio.fei.edu.br:FEI/437
network_acronym_str	FEI
network_name_str	Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str	https://repositorio.fei.edu.br/oai/request
spelling	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simuladoInteligência artificialRobóticaO aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porém, esta técnica não é eficiente o bastante para ser usada em aplicações com exigências do mundo real, devido ao tempo que o agente leva para aprender. Este trabalho apresenta o uso do Aprendizado por Reforço acelerado por heurísticas, no domínio da robótica móvel, utilizando para testes a plataforma do Robocup 2D simulação. Esta plataforma vem sendo usada cada dia mais no meio científico, a qual possiblita fazer inúmeros experimentos com jogadores virtuais, sem sofrer com problemas que comumente são encontrados em sistemas reais, além de manterem sempre as mesmas características de ambiente. O principal problema abordado neste trabalho é o uso da aceleração por heurísticas no Aprendizado por Reforço. Porém esta aceleração só é possível se primeiro for resolvido o problema de como desenvolver um sistema com Aprendizado por Reforço no Robocup 2D. Tal sistema apresenta diversos desafios, sendo o maior deles o tamanho do ambiente, o que gera grande dificuldade para um agente aprender uma política de decisões. Para solucionar este problema forma propostas formas de generalizar os estados, sem causar qualquer interferência no aprendizado. As experiências realizadas foram feitas sem o uso das heurísticas e depois com o uso das heurísticas. para a validação do trabalho, cada experimento foi repetido dez vezes, e seus resultados médios comparados através de uma análise estatística. Os resultados indicam algumas vantagens no uso das heurísticas, possibilitando a definição de algumas diretrizes importantes para a aplicação do uso de heurísticas no domínio do futebol de robôs simulado.The Reinforcement Learning is a very well known technique for the solution of problems when the agent needs to act with sucess in an unknown place through trial and error. However, this technique is not efficient enough to be used in applications with demands of the heuristics accelerated reinforcement learning in the domain of the movable robotics, using for tests the platform of RoboCup 2D simulation. This platform has been used every day more in the scientific way, it makes possible to do countless experiments with virtual players, without suffering of problems that commonly are found in real systems, besides they always maintain the same characteristics of the ambient. The main problem approached in this work is the use of the heuristics accelerated reinforcement learning. However this acceleration is only possible if first the problem be solved of how to develop a system with Reinforcement Learning in RoboCup 2D. Such system presents several challenges, being the largest the size of the ambient generating great difficulty for an agent to learn a politics of decisions. To solve this problem forms they were proposed of generalizing the states, without causing any loss in the learning. The accomplished experiences were made without the use of the heuristics and later with the use of the heuristics. For the validation of the work, each experiment was repeated ten times, and their medium results compared through a statistical analysis. The results indicate some advantages in the use of the heuristics, making possible the definition of some important guidelines for the application of the use of heuristics in the domain of the simulated soccer of robots.Centro Universitário da Fei, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaCeliberto Jr., L. A.2019-03-20T14:00:53Z2019-03-20T14:00:53Z2007info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCELIBERTO JR., L. A. <b> Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado. </b> <b></b> 2007. 122 f.. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_arquivos/1/TDE-2009-01-05T154325Z-15/Publico/Dissertacao%20LuizCelibertoJr.pdf>. Acesso em: 3 fev. 2009.https://repositorio.fei.edu.br/handle/FEI/437porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2023-03-14T12:56:16Zoai:repositorio.fei.edu.br:FEI/437Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2023-03-14T12:56:16Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
title	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
spellingShingle	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado Celiberto Jr., L. A. Inteligência artificial Robótica
title_short	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
title_full	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
title_fullStr	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
title_full_unstemmed	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
title_sort	Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado
author	Celiberto Jr., L. A.
author_facet	Celiberto Jr., L. A.
author_role	author
dc.contributor.none.fl_str_mv	Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv	Celiberto Jr., L. A.
dc.subject.por.fl_str_mv	Inteligência artificial Robótica
topic	Inteligência artificial Robótica
description	O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porém, esta técnica não é eficiente o bastante para ser usada em aplicações com exigências do mundo real, devido ao tempo que o agente leva para aprender. Este trabalho apresenta o uso do Aprendizado por Reforço acelerado por heurísticas, no domínio da robótica móvel, utilizando para testes a plataforma do Robocup 2D simulação. Esta plataforma vem sendo usada cada dia mais no meio científico, a qual possiblita fazer inúmeros experimentos com jogadores virtuais, sem sofrer com problemas que comumente são encontrados em sistemas reais, além de manterem sempre as mesmas características de ambiente. O principal problema abordado neste trabalho é o uso da aceleração por heurísticas no Aprendizado por Reforço. Porém esta aceleração só é possível se primeiro for resolvido o problema de como desenvolver um sistema com Aprendizado por Reforço no Robocup 2D. Tal sistema apresenta diversos desafios, sendo o maior deles o tamanho do ambiente, o que gera grande dificuldade para um agente aprender uma política de decisões. Para solucionar este problema forma propostas formas de generalizar os estados, sem causar qualquer interferência no aprendizado. As experiências realizadas foram feitas sem o uso das heurísticas e depois com o uso das heurísticas. para a validação do trabalho, cada experimento foi repetido dez vezes, e seus resultados médios comparados através de uma análise estatística. Os resultados indicam algumas vantagens no uso das heurísticas, possibilitando a definição de algumas diretrizes importantes para a aplicação do uso de heurísticas no domínio do futebol de robôs simulado.
publishDate	2007
dc.date.none.fl_str_mv	2007 2019-03-20T14:00:53Z 2019-03-20T14:00:53Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	CELIBERTO JR., L. A. <b> Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado. </b> <b></b> 2007. 122 f.. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_arquivos/1/TDE-2009-01-05T154325Z-15/Publico/Dissertacao%20LuizCelibertoJr.pdf>. Acesso em: 3 fev. 2009. https://repositorio.fei.edu.br/handle/FEI/437
identifier_str_mv	CELIBERTO JR., L. A. <b> Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado. </b> <b></b> 2007. 122 f.. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_arquivos/1/TDE-2009-01-05T154325Z-15/Publico/Dissertacao%20LuizCelibertoJr.pdf>. Acesso em: 3 fev. 2009.
url	https://repositorio.fei.edu.br/handle/FEI/437
dc.language.iso.fl_str_mv	por pt_BR
language	por
language_invalid_str_mv	pt_BR
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Centro Universitário da Fei, São Bernardo do Campo
publisher.none.fl_str_mv	Centro Universitário da Fei, São Bernardo do Campo
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI
instname_str	Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str	FEI
institution	FEI
reponame_str	Biblioteca Digital de Teses e Dissertações da FEI
collection	Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv	cfernandes@fei.edu.br
_version_	1809225179516108800

Aprendizado por reforço acelerado por heurísticas no domínio do futebol de robôs simulado

Registros relacionados