Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo

Ferreira, L. A.

Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo

Detalhes bibliográficos
Autor(a) principal:	Ferreira, L. A.
Data de Publicação:	2012
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo:	https://repositorio.fei.edu.br/handle/FEI/414
Resumo:	O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.

Metadados do item

id	FEI_ae49cccb9e64d8e7690d3e03abab4de7
oai_identifier_str	oai:repositorio.fei.edu.br:FEI/414
network_acronym_str	FEI
network_name_str	Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str	https://repositorio.fei.edu.br/oai/request
spelling	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivoHeurísticaO objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.The goal of this work is to study heuristically accelerated Reinforcement Learning techniques to solve multi-agent multi-objective problems. From well known algorithms, two new methods based on Modular Reinforcement Learning, in which the objectives are divided in modules of Heuristically Accelerated Reinforcement Learning, were proposed. Experiments were made in different configurations of the Predator-Prey problem where the learning agent plays the role of the prey and must learn to escape the predator while searching for the food that is kept in a fixed position of the map. The results shows that by modularizing the problem it is possible to simplify the learning process and, when using heuristics for acceleration, the learning agent needs less time to learn to solve the problem when compared to conventional Reinforcement Learning algorithms.Centro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaFerreira, L. A.2019-03-20T14:00:50Z2019-03-20T14:00:50Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.https://repositorio.fei.edu.br/handle/FEI/414porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2019-05-07T16:38:43Zoai:repositorio.fei.edu.br:FEI/414Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2019-05-07T16:38:43Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
spellingShingle	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo Ferreira, L. A. Heurística
title_short	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_full	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_fullStr	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_full_unstemmed	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
title_sort	Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo
author	Ferreira, L. A.
author_facet	Ferreira, L. A.
author_role	author
dc.contributor.none.fl_str_mv	Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv	Ferreira, L. A.
dc.subject.por.fl_str_mv	Heurística
topic	Heurística
description	O objetivo deste trabalho é estudar técnicas de Aprendizado por Reforço aceleradas por Heurísticas para a resolução de problemas multiagente e multiobjetivo. A partir dos algoritmos estudados foram propostos dois métodos baseados em Aprendizado por Reforço Modular que utilizam a decomposição de objetivos em módulos de Aprendizado por Reforço acelerado por Heurísticas. Os experimentos foram realizados em diferentes configurações do domínio da Presa e Predador, no qual o agente aprendiz tem o papel de presa e deve aprender a fugir de um predador enquanto busca a comida que está em um ponto fixo do mapa. A análise dos resultados obtidos mostram que a modularização do problema pode simplificar o processo de aprendizado e, quando unidos a heurísticas, o agente aprendiz necessita de menos tempo para resolver o problema se comparado a algoritmos de Aprendizado por Reforço convencionais.
publishDate	2012
dc.date.none.fl_str_mv	2012 2019-03-20T14:00:50Z 2019-03-20T14:00:50Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012. https://repositorio.fei.edu.br/handle/FEI/414
identifier_str_mv	FERREIRA, L. A. <b> Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo. </b> 2012. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=225>. Acesso em: 10 maio 2012.
url	https://repositorio.fei.edu.br/handle/FEI/414
dc.language.iso.fl_str_mv	por pt_BR
language	por
language_invalid_str_mv	pt_BR
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI
instname_str	Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str	FEI
institution	FEI
reponame_str	Biblioteca Digital de Teses e Dissertações da FEI
collection	Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv	cfernandes@fei.edu.br
_version_	1809225180172517376

Aprendizado por reforço modular acelerado por heurísticas aplicado a problemas multiagente e multiobjetivo

Registros relacionados