Uma estratégia de futebol de robôs baseada em aprendizado por reforço
Main Author: | |
---|---|
Publication Date: | 2023 |
Format: | Bachelor thesis |
Language: | por |
Source: | Repositório Institucional da UNESP |
Download full: | http://hdl.handle.net/11449/239202 |
Summary: | O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira. |
id |
UNSP_171e76347515d0c8ac5b3d9d894fff40 |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/239202 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Uma estratégia de futebol de robôs baseada em aprendizado por reforçoA robot soccer strategy based on reinforcement learningInteligência artificialAprendizado do computadorRedes neurais (Computação)Artificial intelligenceMachine learning DLCNeural networks (Computer science)O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira.The use of machine learning techniques has become very popular in recent years with advances in several areas such as autonomous cars, image and text generation. Robot soccer, where several agents interact, is a favorable environment for the application and verification of learning techniques. In this work, reinforcement learning techniques were applied to train a completely autonomous robot soccer strategy to mitigate the problems of the strategy based on deterministic finite automata. To this end, the robot soccer environment of the Carrossel Caipira team was adapted as a standardized reinforcement learning problem using the Gym library and then trained with the Soft Actor-Critic algorithm with the implementation of the Stable Baselines 3 library, as it is ideal for problems with continuous action spaces. Initially, the goalkeeper was trained with the midfielder and striker of the previous strategy for testing purposes before continuing training with the current midfielder and striker after it was verified that the environment was working and the goalkeeper was learning. The rewards obtained during training were saved and graphically analyzed along with the players’ behavior observed during training. For the goalkeeper, he learned to defend the goal as learning progressed, but for the midfielder and striker more training time is needed to learn their positions well. It was also possible to observe the tendency of positioning the robots in certain positions in the field to maximize their rewards. This work was developed based on the rules of the IEEE Very Small Size Soccer competition in which the Carrossel Caipira team participates.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Pegoraro, Renê [UNESP]Universidade Estadual Paulista (Unesp)Rossetti, Rodrigo César Barboza2023-02-01T11:57:23Z2023-02-01T11:57:23Z2023-01-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/239202porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-26T06:09:29Zoai:repositorio.unesp.br:11449/239202Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462023-11-26T06:09:29Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço A robot soccer strategy based on reinforcement learning |
title |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
spellingShingle |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço Rossetti, Rodrigo César Barboza Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science) |
title_short |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
title_full |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
title_fullStr |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
title_full_unstemmed |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
title_sort |
Uma estratégia de futebol de robôs baseada em aprendizado por reforço |
author |
Rossetti, Rodrigo César Barboza |
author_facet |
Rossetti, Rodrigo César Barboza |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pegoraro, Renê [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Rossetti, Rodrigo César Barboza |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science) |
topic |
Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science) |
description |
O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-02-01T11:57:23Z 2023-02-01T11:57:23Z 2023-01-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/239202 |
url |
http://hdl.handle.net/11449/239202 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1799965071863971840 |