Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
Autor(a) principal: | |
---|---|
Data de Publicação: | 2007 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da FEI |
Texto Completo: | https://repositorio.fei.edu.br/handle/FEI/417 |
Resumo: | Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço |
id |
FEI_93d0bbd4f0c931c60e91377d402f0329 |
---|---|
oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/417 |
network_acronym_str |
FEI |
network_name_str |
Biblioteca Digital de Teses e Dissertações da FEI |
repository_id_str |
https://repositorio.fei.edu.br/oai/request |
spelling |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôsInteligência artificialDomóticaProgramação heurísticaRobôs-Sistemas de controle JogosEsse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por ReforçoThis work present a comparison between Reinforcement Learning algorithms with and without the use of heuristics to accelerate the learning tsk in a simulated environment and the knowledge transfer, through heuristics, for the real environment. The Robot-Soccer environment is used as a test platform, because it is a complex, dynamic and non-deterministic environment. The environments' informations were abstracted and the state space was defined by regions, while the action space represents different high level behaviors. Experiments were done in real and simulated environments. The test in simulated environment showed that heuristics accelerate the learning significantly. For the real environment tests, a complete system of a Robot-Soccer team was developed and the learning acquired in the simulated environment was transferred through heuristics. The results showed that the heuristically accelerated Reinforcement Learning algorithms imply in a better performance when compared with traditional Reinforcement Learning algorithmsCentro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaMartins, Murilo Fernandes2019-03-20T14:00:51Z2019-03-20T14:00:51Z2007info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.https://repositorio.fei.edu.br/handle/FEI/417porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2024-03-01T22:48:04Zoai:repositorio.fei.edu.br:FEI/417Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T22:48:04Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
dc.title.none.fl_str_mv |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
title |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
spellingShingle |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs Martins, Murilo Fernandes Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos |
title_short |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
title_full |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
title_fullStr |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
title_full_unstemmed |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
title_sort |
Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs |
author |
Martins, Murilo Fernandes |
author_facet |
Martins, Murilo Fernandes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bianchi, Reinaldo Augusto da Costa |
dc.contributor.author.fl_str_mv |
Martins, Murilo Fernandes |
dc.subject.por.fl_str_mv |
Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos |
topic |
Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos |
description |
Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço |
publishDate |
2007 |
dc.date.none.fl_str_mv |
2007 2019-03-20T14:00:51Z 2019-03-20T14:00:51Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009. https://repositorio.fei.edu.br/handle/FEI/417 |
identifier_str_mv |
MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009. |
url |
https://repositorio.fei.edu.br/handle/FEI/417 |
dc.language.iso.fl_str_mv |
por pt_BR |
language |
por |
language_invalid_str_mv |
pt_BR |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
instacron_str |
FEI |
institution |
FEI |
reponame_str |
Biblioteca Digital de Teses e Dissertações da FEI |
collection |
Biblioteca Digital de Teses e Dissertações da FEI |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI) |
repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
_version_ |
1809225176758353920 |