Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo

Detalhes bibliográficos
Autor(a) principal: Ferreira, L. A.
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo: https://repositorio.fei.edu.br/handle/FEI/414
Resumo: O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.
id FEI_ae49cccb9e64d8e7690d3e03abab4de7
oai_identifier_str oai:repositorio.fei.edu.br:FEI/414
network_acronym_str FEI
network_name_str Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str https://repositorio.fei.edu.br/oai/request
spelling Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivoHeurísticaO objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.The goal of this work is to study heuristically accelerated Reinforcement Learning techniques to solve multi-agent multi-objective problems. From well known algorithms, two new methods based on Modular Reinforcement Learning, in which the objectives are divided in modules of Heuristically Accelerated Reinforcement Learning, were proposed. Experiments were made in different configurations of the Predator-Prey problem where the learning agent plays the role of the prey and must learn to escape the predator while searching for the food that is kept in a fixed position of the map. The results shows that by modularizing the problem it is possible to simplify the learning process and, when using heuristics for acceleration, the learning agent needs less time to learn to solve the problem when compared to conventional Reinforcement Learning algorithms.Centro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaFerreira, L. A.2019-03-20T14:00:50Z2019-03-20T14:00:50Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.https://repositorio.fei.edu.br/handle/FEI/414porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2019-05-07T16:38:43Zoai:repositorio.fei.edu.br:FEI/414Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2019-05-07T16:38:43Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
spellingShingle Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
Ferreira, L. A.
Heurística
title_short Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_full Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_fullStr Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_full_unstemmed Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_sort Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
author Ferreira, L. A.
author_facet Ferreira, L. A.
author_role author
dc.contributor.none.fl_str_mv Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv Ferreira, L. A.
dc.subject.por.fl_str_mv Heurística
topic Heurística
description O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.
publishDate 2012
dc.date.none.fl_str_mv 2012
2019-03-20T14:00:50Z
2019-03-20T14:00:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.
https://repositorio.fei.edu.br/handle/FEI/414
identifier_str_mv FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.
url https://repositorio.fei.edu.br/handle/FEI/414
dc.language.iso.fl_str_mv por
pt_BR
language por
language_invalid_str_mv pt_BR
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da FEI
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Biblioteca Digital de Teses e Dissertações da FEI
collection Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1809225180172517376