Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/238118 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia Eletrônica. |
id |
UFSC_3ba84e0632bf3f6faa4de62d7352d861 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/238118 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforçopêndulo-invertidomodelocontroleinteligência-artificialaprendizado-por-reforçoinverted-pendulummodelcontrolartificial-intelligencereinforcement-learningTCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia Eletrônica.Este trabalho trata de uma pesquisa experimental de simulação virtual com um modelo robótico do tipo pêndulo invertido sobre duas rodas paralelas. O equilíbrio deste sistema compõe uma tarefa clássica para a área de controle. Neste sistema, devido as propriedades como não linearidade e instabilidade, existem dificuldades para a aplicação de diversos algoritmos de controle clássico. Neste contexto, propõe-se uma abordagem alternativa para este sistema, com controladores baseados em inteligência artificial. O robô foi modelado em espaço de estados com base em leis de Newton e circuitos elétricos, incluindo parâmetros como momentos de inércia, indutância do motor, forças de atrito e efeitos da redução mecânica. Para tornar o modelo mais realista, os parâmetros do motor foram determinados a partir de um motor real. Neste modelo, o objetivo foi controlar tanto a inclinação como a posição do robô, definida em relação ao plano em que este se desloca. Para isso, aplicou-se dois algoritmos de aprendizado por reforço, Double Deep Q-Network, que utiliza redes neurais artificiais para tratar o espaço de estados de forma contínua e Twin Delayed Deep Deterministic Policy Gradient, que atua com estados e ações em domínio contínuo. Desta forma, solucionou-se a tarefa de controle através de aprendizado por tentativa e erro, sem necessidade de conhecimentos prévios sobre o sistema. A performance dos controladores resultantes, assim como a eficiência de seus treinamentos, foi avaliada com múltiplas simulações. Além disso, verificou-se o efeito de ruídos em medidas de sensores utilizados em aplicações práticas e a aplicação de um sinal de entrada para controlar a posição do robô. Por fim, avaliou-se efeitos de modificações na função que caracteriza o objetivo dos controladores. Assim, foi concluído que os algoritmos aplicados possuem potencial para superar controladores clássicos em diversos aspectos. Porém, estes métodos também apresentam dificuldades em suas implementações.This work presents an experimental research of virtual simulation with a robotic model of the type inverted pendulum on two parallel wheels. The balance of this system is a classic task for the control area. In this system, due to properties such as nonlinearity and instability, there are difficulties in the application of several classical control algorithms. In this context, an alternative approach to this system is proposed, with controllers based on artificial intelligence. The robot was modeled in state space based on Newton’s laws and electrical circuits, including parameters such as moments of inertia, motor inductance, friction forces and effects of mechanical reduction. To make the model more realistic, the motor parameters were derived from a real engine. In this model, the objective was to control both the inclination and the position of the robot, defined in relation to the plane in which it moves. For this, two reinforcement learning algorithms were applied, Double Deep Q-Network, which uses artificial neural networks to treat the state space continuously and Twin Delayed Deep Deterministic Policy Gradient, which works with states and actions in a continuous domain. Therefore, the control task was solved through trial and error learning, without the need for previous knowledge about the system. The performance of the resulting controllers, as well as the efficiency of their training, was evaluated with multiple simulations. In addition, the effect of noise on sensor measurements used in practical applications and the application of an input signal to control the robot’s position was verified. Finally, the effects of changes in the function that characterize the objective of the controllers were evaluated. Thus, it was concluded that the applied algorithms have the potential to overcome classical controllers in several aspects. However, these methods also present difficulties in their implementation.Florianópolis, SCMoreto, MiguelUniversidade Federal de Santa CatarinaCarvalho, Jonattan Alves de2022-08-10T13:44:17Z2022-08-10T13:44:17Z2022-08-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis93 f.application/pdfhttps://repositorio.ufsc.br/handle/123456789/238118info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2022-08-10T13:44:17Zoai:repositorio.ufsc.br:123456789/238118Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732022-08-10T13:44:17Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
title |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
spellingShingle |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço Carvalho, Jonattan Alves de pêndulo-invertido modelo controle inteligência-artificial aprendizado-por-reforço inverted-pendulum model control artificial-intelligence reinforcement-learning |
title_short |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
title_full |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
title_fullStr |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
title_full_unstemmed |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
title_sort |
Modelagem e controle de um robô do tipo pêndulo invertido utilizando aprendizado por reforço |
author |
Carvalho, Jonattan Alves de |
author_facet |
Carvalho, Jonattan Alves de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Moreto, Miguel Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Carvalho, Jonattan Alves de |
dc.subject.por.fl_str_mv |
pêndulo-invertido modelo controle inteligência-artificial aprendizado-por-reforço inverted-pendulum model control artificial-intelligence reinforcement-learning |
topic |
pêndulo-invertido modelo controle inteligência-artificial aprendizado-por-reforço inverted-pendulum model control artificial-intelligence reinforcement-learning |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia Eletrônica. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-08-10T13:44:17Z 2022-08-10T13:44:17Z 2022-08-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/238118 |
url |
https://repositorio.ufsc.br/handle/123456789/238118 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
93 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC |
publisher.none.fl_str_mv |
Florianópolis, SC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652329447063552 |