Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/39534 |
Resumo: | Trabalho de Conclusão de Curso (Graduação) |
id |
UFU_a5c890b0913b190aba470b09282f597d |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/39534 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
Implementação do Q-learning no rastreamento de referências constantes em um aeropênduloImplementation of Q-learning in tracking constant references in an aeropendulumAprendizado por reforçoQ-learningAeropênduloControle em malha fechadaCNPQ::ENGENHARIAS::ENGENHARIA MECANICATrabalho de Conclusão de Curso (Graduação)O objetivo deste trabalho é aplicar um método de aprendizado de máquina no controle de um aeropêndulo. Especificamente, o método \textit{Q-Learning} de aprendizado por reforço é utilizado para fazer com que a haste do aeropêndulo seja guiada para uma referência. Para isso, primeiramente um modelo matemático não linear para descrever a dinâmica do sistema é desenvolvido. Mais ainda, o espaço de estados e ações admissíveis foram discretizados, e foi definida uma função de recompensas para fazer com que o agente aprenda a realizar a tarefa de controle. Tal função retorna recompensas positivas ao agente caso a haste permaneça em um ângulo de referência com a base. Já recompensas negativas são atribuídas quando um estado terminal é atingido. As ações possíveis de serem tomadas em um estado são acelerar ou desacelerar o motor. A magnitude da aceleração/desaceleração depende da magnitude do erro de rastreamento. Análises do número de episódios de treinamento necessários para que o agente aprenda a realizar a tarefa, e da influência dos parâmetros de ajuste no aprendizado são realizadas. Os resultados mostram que o agente aprendeu a controlar o aeropêndulo sem erro de rastreamento em regime permanente em todos os casos após o treinamento, indicando a viabilidade da aplicação deste tipo de método no controle de sistemas não lineares. Identificou-se que são necessários aproximadamente 2900 episódios para que o aprendizado seja concluído. Mais ainda, verificou-se que ao aumentar o fator de ganância e a taxa de aprendizagem, a resposta transitória do sistema melhorou. Já variando-se o fator de desconto, os melhores resultados foram obtidos com valores intermediários.Universidade Federal de UberlândiaBrasilEngenharia MecatrônicaAssis, Pedro Augusto Queiroz dehttp://lattes.cnpq.br/5309540309123503Andrade, João Rodrigohttp://lattes.cnpq.br/3633955382225394Paes, Luiz Eduardo dos Santoshttp://lattes.cnpq.br/7357828735124785Morais Filho, Cleiton Kennedy de2023-11-28T14:12:30Z2023-11-28T14:12:30Z2023-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.https://repositorio.ufu.br/handle/123456789/39534porhttp://creativecommons.org/licenses/by/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2023-11-29T06:15:39Zoai:repositorio.ufu.br:123456789/39534Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2023-11-29T06:15:39Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo Implementation of Q-learning in tracking constant references in an aeropendulum |
title |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
spellingShingle |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo Morais Filho, Cleiton Kennedy de Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA |
title_short |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
title_full |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
title_fullStr |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
title_full_unstemmed |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
title_sort |
Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo |
author |
Morais Filho, Cleiton Kennedy de |
author_facet |
Morais Filho, Cleiton Kennedy de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Assis, Pedro Augusto Queiroz de http://lattes.cnpq.br/5309540309123503 Andrade, João Rodrigo http://lattes.cnpq.br/3633955382225394 Paes, Luiz Eduardo dos Santos http://lattes.cnpq.br/7357828735124785 |
dc.contributor.author.fl_str_mv |
Morais Filho, Cleiton Kennedy de |
dc.subject.por.fl_str_mv |
Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA |
topic |
Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA |
description |
Trabalho de Conclusão de Curso (Graduação) |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-11-28T14:12:30Z 2023-11-28T14:12:30Z 2023-11-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023. https://repositorio.ufu.br/handle/123456789/39534 |
identifier_str_mv |
MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023. |
url |
https://repositorio.ufu.br/handle/123456789/39534 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/3.0/us/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/3.0/us/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Engenharia Mecatrônica |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Engenharia Mecatrônica |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1805569734279692288 |