Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo

Detalhes bibliográficos
Autor(a) principal: Morais Filho, Cleiton Kennedy de
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/39534
Resumo: Trabalho de Conclusão de Curso (Graduação)
id UFU_a5c890b0913b190aba470b09282f597d
oai_identifier_str oai:repositorio.ufu.br:123456789/39534
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Implementação do Q-learning no rastreamento de referências constantes em um aeropênduloImplementation of Q-learning in tracking constant references in an aeropendulumAprendizado por reforçoQ-learningAeropênduloControle em malha fechadaCNPQ::ENGENHARIAS::ENGENHARIA MECANICATrabalho de Conclusão de Curso (Graduação)O objetivo deste trabalho é aplicar um método de aprendizado de máquina no controle de um aeropêndulo. Especificamente, o método \textit{Q-Learning} de aprendizado por reforço é utilizado para fazer com que a haste do aeropêndulo seja guiada para uma referência. Para isso, primeiramente um modelo matemático não linear para descrever a dinâmica do sistema é desenvolvido. Mais ainda, o espaço de estados e ações admissíveis foram discretizados, e foi definida uma função de recompensas para fazer com que o agente aprenda a realizar a tarefa de controle. Tal função retorna recompensas positivas ao agente caso a haste permaneça em um ângulo de referência com a base. Já recompensas negativas são atribuídas quando um estado terminal é atingido. As ações possíveis de serem tomadas em um estado são acelerar ou desacelerar o motor. A magnitude da aceleração/desaceleração depende da magnitude do erro de rastreamento. Análises do número de episódios de treinamento necessários para que o agente aprenda a realizar a tarefa, e da influência dos parâmetros de ajuste no aprendizado são realizadas. Os resultados mostram que o agente aprendeu a controlar o aeropêndulo sem erro de rastreamento em regime permanente em todos os casos após o treinamento, indicando a viabilidade da aplicação deste tipo de método no controle de sistemas não lineares. Identificou-se que são necessários aproximadamente 2900 episódios para que o aprendizado seja concluído. Mais ainda, verificou-se que ao aumentar o fator de ganância e a taxa de aprendizagem, a resposta transitória do sistema melhorou. Já variando-se o fator de desconto, os melhores resultados foram obtidos com valores intermediários.Universidade Federal de UberlândiaBrasilEngenharia MecatrônicaAssis, Pedro Augusto Queiroz dehttp://lattes.cnpq.br/5309540309123503Andrade, João Rodrigohttp://lattes.cnpq.br/3633955382225394Paes, Luiz Eduardo dos Santoshttp://lattes.cnpq.br/7357828735124785Morais Filho, Cleiton Kennedy de2023-11-28T14:12:30Z2023-11-28T14:12:30Z2023-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.https://repositorio.ufu.br/handle/123456789/39534porhttp://creativecommons.org/licenses/by/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2023-11-29T06:15:39Zoai:repositorio.ufu.br:123456789/39534Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2023-11-29T06:15:39Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
Implementation of Q-learning in tracking constant references in an aeropendulum
title Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
spellingShingle Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
Morais Filho, Cleiton Kennedy de
Aprendizado por reforço
Q-learning
Aeropêndulo
Controle em malha fechada
CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
title_short Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_full Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_fullStr Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_full_unstemmed Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_sort Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
author Morais Filho, Cleiton Kennedy de
author_facet Morais Filho, Cleiton Kennedy de
author_role author
dc.contributor.none.fl_str_mv Assis, Pedro Augusto Queiroz de
http://lattes.cnpq.br/5309540309123503
Andrade, João Rodrigo
http://lattes.cnpq.br/3633955382225394
Paes, Luiz Eduardo dos Santos
http://lattes.cnpq.br/7357828735124785
dc.contributor.author.fl_str_mv Morais Filho, Cleiton Kennedy de
dc.subject.por.fl_str_mv Aprendizado por reforço
Q-learning
Aeropêndulo
Controle em malha fechada
CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
topic Aprendizado por reforço
Q-learning
Aeropêndulo
Controle em malha fechada
CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
description Trabalho de Conclusão de Curso (Graduação)
publishDate 2023
dc.date.none.fl_str_mv 2023-11-28T14:12:30Z
2023-11-28T14:12:30Z
2023-11-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.
https://repositorio.ufu.br/handle/123456789/39534
identifier_str_mv MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.
url https://repositorio.ufu.br/handle/123456789/39534
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/3.0/us/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/3.0/us/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Engenharia Mecatrônica
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Engenharia Mecatrônica
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1805569734279692288