Aprendizado por reforço utilizando tile coding em cenários multiagente

Detalhes bibliográficos
Autor(a) principal: Waskow, Samuel Justo
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/28349
Resumo: Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular.
id URGS_12695edf94a078a84e5ee784d52ecbc9
oai_identifier_str oai:www.lume.ufrgs.br:10183/28349
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Waskow, Samuel JustoBazzan, Ana Lucia Cetertich2011-03-31T06:00:03Z2010http://hdl.handle.net/10183/28349000769941Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular.Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one.application/pdfporInteligência artificialSistemas multiagentesAgentes inteligentesArtificial intelligenceMultiagent systemsReinforcement learningFunction approximationAprendizado por reforço utilizando tile coding em cenários multiagenteReinforcement learning using tile coding in multiagent scenarios info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2010mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000769941.pdf.txt000769941.pdf.txtExtracted Texttext/plain189329http://www.lume.ufrgs.br/bitstream/10183/28349/2/000769941.pdf.txtf84784af584e2dcdd0aa00205e15cc8bMD52ORIGINAL000769941.pdf000769941.pdfTexto completoapplication/pdf1123090http://www.lume.ufrgs.br/bitstream/10183/28349/1/000769941.pdf7f384d7591aa33ff11f40e2c930d26c6MD51THUMBNAIL000769941.pdf.jpg000769941.pdf.jpgGenerated Thumbnailimage/jpeg1002http://www.lume.ufrgs.br/bitstream/10183/28349/3/000769941.pdf.jpg44b2c0086ac8ad5bd99208d671ca3437MD5310183/283492018-10-08 09:23:40.376oai:www.lume.ufrgs.br:10183/28349Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-08T12:23:40Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aprendizado por reforço utilizando tile coding em cenários multiagente
dc.title.alternative.en.fl_str_mv Reinforcement learning using tile coding in multiagent scenarios
title Aprendizado por reforço utilizando tile coding em cenários multiagente
spellingShingle Aprendizado por reforço utilizando tile coding em cenários multiagente
Waskow, Samuel Justo
Inteligência artificial
Sistemas multiagentes
Agentes inteligentes
Artificial intelligence
Multiagent systems
Reinforcement learning
Function approximation
title_short Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full Aprendizado por reforço utilizando tile coding em cenários multiagente
title_fullStr Aprendizado por reforço utilizando tile coding em cenários multiagente
title_full_unstemmed Aprendizado por reforço utilizando tile coding em cenários multiagente
title_sort Aprendizado por reforço utilizando tile coding em cenários multiagente
author Waskow, Samuel Justo
author_facet Waskow, Samuel Justo
author_role author
dc.contributor.author.fl_str_mv Waskow, Samuel Justo
dc.contributor.advisor1.fl_str_mv Bazzan, Ana Lucia Cetertich
contributor_str_mv Bazzan, Ana Lucia Cetertich
dc.subject.por.fl_str_mv Inteligência artificial
Sistemas multiagentes
Agentes inteligentes
topic Inteligência artificial
Sistemas multiagentes
Agentes inteligentes
Artificial intelligence
Multiagent systems
Reinforcement learning
Function approximation
dc.subject.eng.fl_str_mv Artificial intelligence
Multiagent systems
Reinforcement learning
Function approximation
description Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2011-03-31T06:00:03Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/28349
dc.identifier.nrb.pt_BR.fl_str_mv 000769941
url http://hdl.handle.net/10183/28349
identifier_str_mv 000769941
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/28349/2/000769941.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/28349/1/000769941.pdf
http://www.lume.ufrgs.br/bitstream/10183/28349/3/000769941.pdf.jpg
bitstream.checksum.fl_str_mv f84784af584e2dcdd0aa00205e15cc8b
7f384d7591aa33ff11f40e2c930d26c6
44b2c0086ac8ad5bd99208d671ca3437
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085194951032832