Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo

Morais Filho, Cleiton Kennedy de

Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo

Detalhes bibliográficos
Autor(a) principal:	Morais Filho, Cleiton Kennedy de
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFU
Texto Completo:	https://repositorio.ufu.br/handle/123456789/39534
Resumo:	Trabalho de Conclusão de Curso (Graduação)

Metadados do item

id	UFU_a5c890b0913b190aba470b09282f597d
oai_identifier_str	oai:repositorio.ufu.br:123456789/39534
network_acronym_str	UFU
network_name_str	Repositório Institucional da UFU
repository_id_str
spelling	Implementação do Q-learning no rastreamento de referências constantes em um aeropênduloImplementation of Q-learning in tracking constant references in an aeropendulumAprendizado por reforçoQ-learningAeropênduloControle em malha fechadaCNPQ::ENGENHARIAS::ENGENHARIA MECANICATrabalho de Conclusão de Curso (Graduação)O objetivo deste trabalho é aplicar um método de aprendizado de máquina no controle de um aeropêndulo. Especificamente, o método \textit{Q-Learning} de aprendizado por reforço é utilizado para fazer com que a haste do aeropêndulo seja guiada para uma referência. Para isso, primeiramente um modelo matemático não linear para descrever a dinâmica do sistema é desenvolvido. Mais ainda, o espaço de estados e ações admissíveis foram discretizados, e foi definida uma função de recompensas para fazer com que o agente aprenda a realizar a tarefa de controle. Tal função retorna recompensas positivas ao agente caso a haste permaneça em um ângulo de referência com a base. Já recompensas negativas são atribuídas quando um estado terminal é atingido. As ações possíveis de serem tomadas em um estado são acelerar ou desacelerar o motor. A magnitude da aceleração/desaceleração depende da magnitude do erro de rastreamento. Análises do número de episódios de treinamento necessários para que o agente aprenda a realizar a tarefa, e da influência dos parâmetros de ajuste no aprendizado são realizadas. Os resultados mostram que o agente aprendeu a controlar o aeropêndulo sem erro de rastreamento em regime permanente em todos os casos após o treinamento, indicando a viabilidade da aplicação deste tipo de método no controle de sistemas não lineares. Identificou-se que são necessários aproximadamente 2900 episódios para que o aprendizado seja concluído. Mais ainda, verificou-se que ao aumentar o fator de ganância e a taxa de aprendizagem, a resposta transitória do sistema melhorou. Já variando-se o fator de desconto, os melhores resultados foram obtidos com valores intermediários.Universidade Federal de UberlândiaBrasilEngenharia MecatrônicaAssis, Pedro Augusto Queiroz dehttp://lattes.cnpq.br/5309540309123503Andrade, João Rodrigohttp://lattes.cnpq.br/3633955382225394Paes, Luiz Eduardo dos Santoshttp://lattes.cnpq.br/7357828735124785Morais Filho, Cleiton Kennedy de2023-11-28T14:12:30Z2023-11-28T14:12:30Z2023-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.https://repositorio.ufu.br/handle/123456789/39534porhttp://creativecommons.org/licenses/by/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2023-11-29T06:15:39Zoai:repositorio.ufu.br:123456789/39534Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2023-11-29T06:15:39Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo Implementation of Q-learning in tracking constant references in an aeropendulum
title	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
spellingShingle	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo Morais Filho, Cleiton Kennedy de Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
title_short	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_full	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_fullStr	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_full_unstemmed	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
title_sort	Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo
author	Morais Filho, Cleiton Kennedy de
author_facet	Morais Filho, Cleiton Kennedy de
author_role	author
dc.contributor.none.fl_str_mv	Assis, Pedro Augusto Queiroz de http://lattes.cnpq.br/5309540309123503 Andrade, João Rodrigo http://lattes.cnpq.br/3633955382225394 Paes, Luiz Eduardo dos Santos http://lattes.cnpq.br/7357828735124785
dc.contributor.author.fl_str_mv	Morais Filho, Cleiton Kennedy de
dc.subject.por.fl_str_mv	Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
topic	Aprendizado por reforço Q-learning Aeropêndulo Controle em malha fechada CNPQ::ENGENHARIAS::ENGENHARIA MECANICA
description	Trabalho de Conclusão de Curso (Graduação)
publishDate	2023
dc.date.none.fl_str_mv	2023-11-28T14:12:30Z 2023-11-28T14:12:30Z 2023-11-14
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023. https://repositorio.ufu.br/handle/123456789/39534
identifier_str_mv	MORAIS FILHO, Cleiton Kennedy de. Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo. 2023. 44 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023.
url	https://repositorio.ufu.br/handle/123456789/39534
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	http://creativecommons.org/licenses/by/3.0/us/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by/3.0/us/
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Federal de Uberlândia Brasil Engenharia Mecatrônica
publisher.none.fl_str_mv	Universidade Federal de Uberlândia Brasil Engenharia Mecatrônica
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU
instname_str	Universidade Federal de Uberlândia (UFU)
instacron_str	UFU
institution	UFU
reponame_str	Repositório Institucional da UFU
collection	Repositório Institucional da UFU
repository.name.fl_str_mv	Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv	diinf@dirbi.ufu.br
_version_	1805569734279692288

Implementação do Q-learning no rastreamento de referências constantes em um aeropêndulo

Registros relacionados