Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da FEI |
Texto Completo: | https://repositorio.fei.edu.br/handle/FEI/414 |
Resumo: | O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais. |
id |
FEI_ae49cccb9e64d8e7690d3e03abab4de7 |
---|---|
oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/414 |
network_acronym_str |
FEI |
network_name_str |
Biblioteca Digital de Teses e Dissertações da FEI |
repository_id_str |
https://repositorio.fei.edu.br/oai/request |
spelling |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivoHeurísticaO objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.The goal of this work is to study heuristically accelerated Reinforcement Learning techniques to solve multi-agent multi-objective problems. From well known algorithms, two new methods based on Modular Reinforcement Learning, in which the objectives are divided in modules of Heuristically Accelerated Reinforcement Learning, were proposed. Experiments were made in different configurations of the Predator-Prey problem where the learning agent plays the role of the prey and must learn to escape the predator while searching for the food that is kept in a fixed position of the map. The results shows that by modularizing the problem it is possible to simplify the learning process and, when using heuristics for acceleration, the learning agent needs less time to learn to solve the problem when compared to conventional Reinforcement Learning algorithms.Centro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaFerreira, L. A.2019-03-20T14:00:50Z2019-03-20T14:00:50Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.https://repositorio.fei.edu.br/handle/FEI/414porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2019-05-07T16:38:43Zoai:repositorio.fei.edu.br:FEI/414Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2019-05-07T16:38:43Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
dc.title.none.fl_str_mv |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
title |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
spellingShingle |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo Ferreira, L. A. Heurística |
title_short |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
title_full |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
title_fullStr |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
title_full_unstemmed |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
title_sort |
Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo |
author |
Ferreira, L. A. |
author_facet |
Ferreira, L. A. |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bianchi, Reinaldo Augusto da Costa |
dc.contributor.author.fl_str_mv |
Ferreira, L. A. |
dc.subject.por.fl_str_mv |
Heurística |
topic |
Heurística |
description |
O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 2019-03-20T14:00:50Z 2019-03-20T14:00:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012. https://repositorio.fei.edu.br/handle/FEI/414 |
identifier_str_mv |
FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012. |
url |
https://repositorio.fei.edu.br/handle/FEI/414 |
dc.language.iso.fl_str_mv |
por pt_BR |
language |
por |
language_invalid_str_mv |
pt_BR |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
instacron_str |
FEI |
institution |
FEI |
reponame_str |
Biblioteca Digital de Teses e Dissertações da FEI |
collection |
Biblioteca Digital de Teses e Dissertações da FEI |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI) |
repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
_version_ |
1809225180172517376 |