Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial

Detalhes bibliográficos
Autor(a) principal: Correia, João Vitor Mariano
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/239124
Resumo: O presente trabalho tem como objetivo o estudo e a implementação de técnicas de aprendizado profundo aplicado ao controle de robôs de acionamento diferencial. A aplicação final destinada dos modelos apresentados são os robôs da categoria IEEE Very Small Size Soccer. Diversas são as técnicas existentes para o controle de tais agentes, as quais podem ser aplicadas em diferentes escopos de controle e navegação robótica. Este trabalho busca uma rede capaz de ser aplicada ao controle local dos agentes, para este fim foi utilizada uma arquitetura que combina uma rede ator-crítico e uma rede crítica DQN auxiliada por um controlador PID. Tal arquitetura possibilita acelerar o processo de aprendizado, uma vez que o controlador clássico pode ser utilizado nas épocas iniciais evitando que o agente faça movimentos aleatórios que pouco retorno traria à rede, e a partir do momento que a política aprendida seja eficiente na locomoção do agente, essa passe a ser utilizada. Os resultados obtidos a partir do treinamento em ambiente simulado foram comparados à implementação original e apresentadas as conclusões a partir destes.
id UNSP_f648d8d5df53f4caf4735f7fb6486259
oai_identifier_str oai:repositorio.unesp.br:11449/239124
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencialAssisted reinforcement learning applied to the control of differential drive robotsRobóticaAprendizado profundoAprendizado por reforçoRoboticsDeep learningReinforcement learningO presente trabalho tem como objetivo o estudo e a implementação de técnicas de aprendizado profundo aplicado ao controle de robôs de acionamento diferencial. A aplicação final destinada dos modelos apresentados são os robôs da categoria IEEE Very Small Size Soccer. Diversas são as técnicas existentes para o controle de tais agentes, as quais podem ser aplicadas em diferentes escopos de controle e navegação robótica. Este trabalho busca uma rede capaz de ser aplicada ao controle local dos agentes, para este fim foi utilizada uma arquitetura que combina uma rede ator-crítico e uma rede crítica DQN auxiliada por um controlador PID. Tal arquitetura possibilita acelerar o processo de aprendizado, uma vez que o controlador clássico pode ser utilizado nas épocas iniciais evitando que o agente faça movimentos aleatórios que pouco retorno traria à rede, e a partir do momento que a política aprendida seja eficiente na locomoção do agente, essa passe a ser utilizada. Os resultados obtidos a partir do treinamento em ambiente simulado foram comparados à implementação original e apresentadas as conclusões a partir destes.This work aims to study and implement deep learning techniques applied to the control of differential drive robots. The model of control is applied in the IEEE Very Small Size Soccer league aiming to validate the code implementation. Several frameworks to control such agents exist and they can be applied to different scopes of robotic control and navigation. This work seeks a network architecture capable of being efficiently applied in the local control of such agents, for this purpose it’s used a architecture of an actor-critic network and a critical DQN network aided by a PID controller. Such an architecture makes it possible to accelerate the learning process since the classic controller can be used in the initial stages, preventing the agent from making random movements that would bring little return to the network and, from the moment that the learned policy is efficient in the agent’s locomotion, this starts to be applied. The results obtained from training in a simulated environment are compared to the original implementation results and the conclusions are presented from these.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Pegoraro, Renê [UNESP]Universidade Estadual Paulista (Unesp)Correia, João Vitor Mariano2023-01-30T16:20:05Z2023-01-30T16:20:05Z2023-01-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/239124porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-11T06:15:31Zoai:repositorio.unesp.br:11449/239124Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T17:24:47.839324Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
Assisted reinforcement learning applied to the control of differential drive robots
title Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
spellingShingle Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
Correia, João Vitor Mariano
Robótica
Aprendizado profundo
Aprendizado por reforço
Robotics
Deep learning
Reinforcement learning
title_short Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
title_full Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
title_fullStr Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
title_full_unstemmed Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
title_sort Aprendizado por reforço assistido aplicado ao controle de robôs de acionamento diferencial
author Correia, João Vitor Mariano
author_facet Correia, João Vitor Mariano
author_role author
dc.contributor.none.fl_str_mv Pegoraro, Renê [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Correia, João Vitor Mariano
dc.subject.por.fl_str_mv Robótica
Aprendizado profundo
Aprendizado por reforço
Robotics
Deep learning
Reinforcement learning
topic Robótica
Aprendizado profundo
Aprendizado por reforço
Robotics
Deep learning
Reinforcement learning
description O presente trabalho tem como objetivo o estudo e a implementação de técnicas de aprendizado profundo aplicado ao controle de robôs de acionamento diferencial. A aplicação final destinada dos modelos apresentados são os robôs da categoria IEEE Very Small Size Soccer. Diversas são as técnicas existentes para o controle de tais agentes, as quais podem ser aplicadas em diferentes escopos de controle e navegação robótica. Este trabalho busca uma rede capaz de ser aplicada ao controle local dos agentes, para este fim foi utilizada uma arquitetura que combina uma rede ator-crítico e uma rede crítica DQN auxiliada por um controlador PID. Tal arquitetura possibilita acelerar o processo de aprendizado, uma vez que o controlador clássico pode ser utilizado nas épocas iniciais evitando que o agente faça movimentos aleatórios que pouco retorno traria à rede, e a partir do momento que a política aprendida seja eficiente na locomoção do agente, essa passe a ser utilizada. Os resultados obtidos a partir do treinamento em ambiente simulado foram comparados à implementação original e apresentadas as conclusões a partir destes.
publishDate 2023
dc.date.none.fl_str_mv 2023-01-30T16:20:05Z
2023-01-30T16:20:05Z
2023-01-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/239124
url http://hdl.handle.net/11449/239124
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128806974652416