Uma estratégia de futebol de robôs baseada em aprendizado por reforço

Rossetti, Rodrigo César Barboza

Uma estratégia de futebol de robôs baseada em aprendizado por reforço

Bibliographic Details
Main Author:	Rossetti, Rodrigo César Barboza
Publication Date:	2023
Format:	Bachelor thesis
Language:	por
Source:	Repositório Institucional da UNESP
Download full:	http://hdl.handle.net/11449/239202
Summary:	O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira.

Item metadata

id	UNSP_171e76347515d0c8ac5b3d9d894fff40
oai_identifier_str	oai:repositorio.unesp.br:11449/239202
network_acronym_str	UNSP
network_name_str	Repositório Institucional da UNESP
repository_id_str	2946
spelling	Uma estratégia de futebol de robôs baseada em aprendizado por reforçoA robot soccer strategy based on reinforcement learningInteligência artificialAprendizado do computadorRedes neurais (Computação)Artificial intelligenceMachine learning DLCNeural networks (Computer science)O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira.The use of machine learning techniques has become very popular in recent years with advances in several areas such as autonomous cars, image and text generation. Robot soccer, where several agents interact, is a favorable environment for the application and verification of learning techniques. In this work, reinforcement learning techniques were applied to train a completely autonomous robot soccer strategy to mitigate the problems of the strategy based on deterministic finite automata. To this end, the robot soccer environment of the Carrossel Caipira team was adapted as a standardized reinforcement learning problem using the Gym library and then trained with the Soft Actor-Critic algorithm with the implementation of the Stable Baselines 3 library, as it is ideal for problems with continuous action spaces. Initially, the goalkeeper was trained with the midfielder and striker of the previous strategy for testing purposes before continuing training with the current midfielder and striker after it was verified that the environment was working and the goalkeeper was learning. The rewards obtained during training were saved and graphically analyzed along with the players’ behavior observed during training. For the goalkeeper, he learned to defend the goal as learning progressed, but for the midfielder and striker more training time is needed to learn their positions well. It was also possible to observe the tendency of positioning the robots in certain positions in the field to maximize their rewards. This work was developed based on the rules of the IEEE Very Small Size Soccer competition in which the Carrossel Caipira team participates.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Pegoraro, Renê [UNESP]Universidade Estadual Paulista (Unesp)Rossetti, Rodrigo César Barboza2023-02-01T11:57:23Z2023-02-01T11:57:23Z2023-01-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/239202porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-26T06:09:29Zoai:repositorio.unesp.br:11449/239202Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462023-11-26T06:09:29Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv	Uma estratégia de futebol de robôs baseada em aprendizado por reforço A robot soccer strategy based on reinforcement learning
title	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
spellingShingle	Uma estratégia de futebol de robôs baseada em aprendizado por reforço Rossetti, Rodrigo César Barboza Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science)
title_short	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
title_full	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
title_fullStr	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
title_full_unstemmed	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
title_sort	Uma estratégia de futebol de robôs baseada em aprendizado por reforço
author	Rossetti, Rodrigo César Barboza
author_facet	Rossetti, Rodrigo César Barboza
author_role	author
dc.contributor.none.fl_str_mv	Pegoraro, Renê [UNESP] Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv	Rossetti, Rodrigo César Barboza
dc.subject.por.fl_str_mv	Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science)
topic	Inteligência artificial Aprendizado do computador Redes neurais (Computação) Artificial intelligence Machine learning DLC Neural networks (Computer science)
description	O uso de técnicas de aprendizado de máquina se popularizou muito nos últimos anos com avanços em diversas áreas como carros autônomos, geração de imagens e texto. O futebol de robôs, onde vários agentes interagem, é um ambiente propício para aplicação e verificação de técnicas de aprendizado. Neste trabalho foi aplicado técnicas de aprendizado por reforço para treinar uma estratégia de futebol de robôs completamente autônoma para mitigar os problemas da estratégia baseada em autômatos finitos determinísticos. Para tal, o ambiente do futebol de robôs do time Carrossel Caipira foi adaptado como um problema padronizado de aprendizado por reforço utilizando a biblioteca Gym e então treinado com o algoritmo Soft Actor-Critic com implementação da biblioteca Stable Baselines 3, por ser ideal para problemas com espaços de ação contínuos. Inicialmente, o goleiro foi treinado junto ao volante e atacante da estratégia anterior para fins de testes antes de continuar o treinamento junto ao volante e atacante atuais ao se constatar que o ambiente estava funcionando e o goleiro aprendendo. As recompensas obtidas durante o treinamento foram salvas e analisadas graficamente junto ao comportamento dos jogadores observado durante o treinamento. Para o goleiro, ele aprendeu a defender o gol conforme o aprendizado progrediu, mas para o volante e atacante é necessário mais tempo de treinamento para aprenderem bem suas posições. Também foi possível observar a tendência de posicionamento dos robôs em certas posições do campo para maximizar suas recompensas. O trabalho foi desenvolvido com base nas regras da competição IEEE Very Small Size Soccer da qual participa a equipe Carrossel Caipira.
publishDate	2023
dc.date.none.fl_str_mv	2023-02-01T11:57:23Z 2023-02-01T11:57:23Z 2023-01-16
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/11449/239202
url	http://hdl.handle.net/11449/239202
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP
instname_str	Universidade Estadual Paulista (UNESP)
instacron_str	UNESP
institution	UNESP
reponame_str	Repositório Institucional da UNESP
collection	Repositório Institucional da UNESP
repository.name.fl_str_mv	Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_	1799965071863971840

Uma estratégia de futebol de robôs baseada em aprendizado por reforço

Similar Items