Aprendizado por reforço utilizando tile coding em cenários multiagente
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/28349 |
Resumo: | Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. |
id |
URGS_12695edf94a078a84e5ee784d52ecbc9 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/28349 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Waskow, Samuel JustoBazzan, Ana Lucia Cetertich2011-03-31T06:00:03Z2010http://hdl.handle.net/10183/28349000769941Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular.Nowadays, researchers are seeking methods to solve reinforcement learning (RL) problems in complex scenarios. RL is an efficient, widely used machine learning technique in single-agent problems. Regarding multiagent systems, in which the state space generally has high dimensionality, standard reinforcement learning approaches may not be adequate. As alternatives, it is possible to use techniques that generalize the state space to enhance the ability of the agents to learn through the use of abstraction. Thus, the focus of this work is to use an existing reinforcement learning technique, namely tile coding, that is a better form of state representation. This kind of method is key in scenarios where agents have a high number of states to explore. In the scenarios used to test and validate this approach, our experimental results indicate that the tile coding state representation outperforms the tabular one.application/pdfporInteligência artificialSistemas multiagentesAgentes inteligentesArtificial intelligenceMultiagent systemsReinforcement learningFunction approximationAprendizado por reforço utilizando tile coding em cenários multiagenteReinforcement learning using tile coding in multiagent scenarios info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2010mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000769941.pdf.txt000769941.pdf.txtExtracted Texttext/plain189329http://www.lume.ufrgs.br/bitstream/10183/28349/2/000769941.pdf.txtf84784af584e2dcdd0aa00205e15cc8bMD52ORIGINAL000769941.pdf000769941.pdfTexto completoapplication/pdf1123090http://www.lume.ufrgs.br/bitstream/10183/28349/1/000769941.pdf7f384d7591aa33ff11f40e2c930d26c6MD51THUMBNAIL000769941.pdf.jpg000769941.pdf.jpgGenerated Thumbnailimage/jpeg1002http://www.lume.ufrgs.br/bitstream/10183/28349/3/000769941.pdf.jpg44b2c0086ac8ad5bd99208d671ca3437MD5310183/283492018-10-08 09:23:40.376oai:www.lume.ufrgs.br:10183/28349Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-08T12:23:40Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
dc.title.alternative.en.fl_str_mv |
Reinforcement learning using tile coding in multiagent scenarios |
title |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
spellingShingle |
Aprendizado por reforço utilizando tile coding em cenários multiagente Waskow, Samuel Justo Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation |
title_short |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_full |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_fullStr |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_full_unstemmed |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
title_sort |
Aprendizado por reforço utilizando tile coding em cenários multiagente |
author |
Waskow, Samuel Justo |
author_facet |
Waskow, Samuel Justo |
author_role |
author |
dc.contributor.author.fl_str_mv |
Waskow, Samuel Justo |
dc.contributor.advisor1.fl_str_mv |
Bazzan, Ana Lucia Cetertich |
contributor_str_mv |
Bazzan, Ana Lucia Cetertich |
dc.subject.por.fl_str_mv |
Inteligência artificial Sistemas multiagentes Agentes inteligentes |
topic |
Inteligência artificial Sistemas multiagentes Agentes inteligentes Artificial intelligence Multiagent systems Reinforcement learning Function approximation |
dc.subject.eng.fl_str_mv |
Artificial intelligence Multiagent systems Reinforcement learning Function approximation |
description |
Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequadas. Como alternativa existem técnicas de generalização do espaço de estados que ampliam a capacidade de aprendizado através de abstrações. Desta maneira, o foco principal deste trabalho é utilizar as técnicas existentes de aprendizado por reforço com aproximação de funções através de tile coding para aplicação nos seguintes cenários: presa-predador, controle de tráfego veicular urbano e jogos de coordenação. Os resultados obtidos nos experimentos demonstram que a representação de estados por tile coding tem desempenho superior à representação tabular. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010 |
dc.date.accessioned.fl_str_mv |
2011-03-31T06:00:03Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/28349 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000769941 |
url |
http://hdl.handle.net/10183/28349 |
identifier_str_mv |
000769941 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/28349/2/000769941.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/28349/1/000769941.pdf http://www.lume.ufrgs.br/bitstream/10183/28349/3/000769941.pdf.jpg |
bitstream.checksum.fl_str_mv |
f84784af584e2dcdd0aa00205e15cc8b 7f384d7591aa33ff11f40e2c930d26c6 44b2c0086ac8ad5bd99208d671ca3437 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085194951032832 |