Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs

Detalhes bibliográficos
Autor(a) principal: Martins, Murilo Fernandes
Data de Publicação: 2007
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo: https://repositorio.fei.edu.br/handle/FEI/417
Resumo: Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço
id FEI_93d0bbd4f0c931c60e91377d402f0329
oai_identifier_str oai:repositorio.fei.edu.br:FEI/417
network_acronym_str FEI
network_name_str Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str https://repositorio.fei.edu.br/oai/request
spelling Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôsInteligência artificialDomóticaProgramação heurísticaRobôs-Sistemas de controle JogosEsse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por ReforçoThis work present a comparison between Reinforcement Learning algorithms with and without the use of heuristics to accelerate the learning tsk in a simulated environment and the knowledge transfer, through heuristics, for the real environment. The Robot-Soccer environment is used as a test platform, because it is a complex, dynamic and non-deterministic environment. The environments' informations were abstracted and the state space was defined by regions, while the action space represents different high level behaviors. Experiments were done in real and simulated environments. The test in simulated environment showed that heuristics accelerate the learning significantly. For the real environment tests, a complete system of a Robot-Soccer team was developed and the learning acquired in the simulated environment was transferred through heuristics. The results showed that the heuristically accelerated Reinforcement Learning algorithms imply in a better performance when compared with traditional Reinforcement Learning algorithmsCentro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaMartins, Murilo Fernandes2019-03-20T14:00:51Z2019-03-20T14:00:51Z2007info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.https://repositorio.fei.edu.br/handle/FEI/417porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2024-03-01T22:48:04Zoai:repositorio.fei.edu.br:FEI/417Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T22:48:04Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
spellingShingle Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
Martins, Murilo Fernandes
Inteligência artificial
Domótica
Programação heurística
Robôs-Sistemas de controle Jogos
title_short Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_full Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_fullStr Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_full_unstemmed Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_sort Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
author Martins, Murilo Fernandes
author_facet Martins, Murilo Fernandes
author_role author
dc.contributor.none.fl_str_mv Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv Martins, Murilo Fernandes
dc.subject.por.fl_str_mv Inteligência artificial
Domótica
Programação heurística
Robôs-Sistemas de controle Jogos
topic Inteligência artificial
Domótica
Programação heurística
Robôs-Sistemas de controle Jogos
description Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço
publishDate 2007
dc.date.none.fl_str_mv 2007
2019-03-20T14:00:51Z
2019-03-20T14:00:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.
https://repositorio.fei.edu.br/handle/FEI/417
identifier_str_mv MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.
url https://repositorio.fei.edu.br/handle/FEI/417
dc.language.iso.fl_str_mv por
pt_BR
language por
language_invalid_str_mv pt_BR
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da FEI
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Biblioteca Digital de Teses e Dissertações da FEI
collection Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1809225176758353920