Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs

Martins, Murilo Fernandes

Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs

Detalhes bibliográficos
Autor(a) principal:	Martins, Murilo Fernandes
Data de Publicação:	2007
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo:	https://repositorio.fei.edu.br/handle/FEI/417
Resumo:	Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço

Metadados do item

id	FEI_93d0bbd4f0c931c60e91377d402f0329
oai_identifier_str	oai:repositorio.fei.edu.br:FEI/417
network_acronym_str	FEI
network_name_str	Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str	https://repositorio.fei.edu.br/oai/request
spelling	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôsInteligência artificialDomóticaProgramação heurísticaRobôs-Sistemas de controle JogosEsse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por ReforçoThis work present a comparison between Reinforcement Learning algorithms with and without the use of heuristics to accelerate the learning tsk in a simulated environment and the knowledge transfer, through heuristics, for the real environment. The Robot-Soccer environment is used as a test platform, because it is a complex, dynamic and non-deterministic environment. The environments' informations were abstracted and the state space was defined by regions, while the action space represents different high level behaviors. Experiments were done in real and simulated environments. The test in simulated environment showed that heuristics accelerate the learning significantly. For the real environment tests, a complete system of a Robot-Soccer team was developed and the learning acquired in the simulated environment was transferred through heuristics. The results showed that the heuristically accelerated Reinforcement Learning algorithms imply in a better performance when compared with traditional Reinforcement Learning algorithmsCentro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaMartins, Murilo Fernandes2019-03-20T14:00:51Z2019-03-20T14:00:51Z2007info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.https://repositorio.fei.edu.br/handle/FEI/417porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2024-03-01T22:48:04Zoai:repositorio.fei.edu.br:FEI/417Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T22:48:04Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
spellingShingle	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs Martins, Murilo Fernandes Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos
title_short	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_full	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_fullStr	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_full_unstemmed	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
title_sort	Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs
author	Martins, Murilo Fernandes
author_facet	Martins, Murilo Fernandes
author_role	author
dc.contributor.none.fl_str_mv	Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv	Martins, Murilo Fernandes
dc.subject.por.fl_str_mv	Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos
topic	Inteligência artificial Domótica Programação heurística Robôs-Sistemas de controle Jogos
description	Esse trabalho apresenta um comparação entre algoritmos de Aprendizado por Reforço com e sem a utilização de heurísticas para aceleração do aprendizado em ambiente simulado e a transferência de conhecimento, através de heurísticas, para o ambiente real. O ambiente de Futebol de Robôs é utilizado como plataforma para os experimentos realizados, pois é um ambiente complexo, dinâmico e não-determinístico. As informações do ambiente foram abstraídas e o conjunto de estados foi definido por regiões, enquanto o conjunto de ações representa diferentes comportamentos de alto nível. Foram efetuados experimentos em ambiente real e simulado. Os testes em ambiente simulado mostraram que heurísticas aceleram o aprendizado significativamente. Para os teste em ambiente real, foi desenvolvido um sistema completo de um time de Futebol de Robôs e o conhecimento adquirido no aprendizado em simulação foi transferido através de heurísticas. Os resultados mostraram que algoritmos de Aprendizado por Reforço acelerados por heurísticas implicam em um melhor desempenho quando comparados com os algoritmos tradicionais de Aprendizado por Reforço
publishDate	2007
dc.date.none.fl_str_mv	2007 2019-03-20T14:00:51Z 2019-03-20T14:00:51Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009. https://repositorio.fei.edu.br/handle/FEI/417
identifier_str_mv	MARTINS, Murilo Fernandes. <b> Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs. </b> 2007. 102 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2007 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=59>. Acesso em: 21 maio 2009.
url	https://repositorio.fei.edu.br/handle/FEI/417
dc.language.iso.fl_str_mv	por pt_BR
language	por
language_invalid_str_mv	pt_BR
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI
instname_str	Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str	FEI
institution	FEI
reponame_str	Biblioteca Digital de Teses e Dissertações da FEI
collection	Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv	cfernandes@fei.edu.br
_version_	1809225176758353920

Aprendizado por reforço acelerado por heurísticas aplicado ao domínio do futebol de robôs

Registros relacionados