Aprendizagem automática aplicada à condução de um veículo com direção Ackermann

Detalhes bibliográficos
Autor(a) principal: Rodrigues, João Gabriel das Neves
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/25129
Resumo: Nos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.
id RCAP_f38fadb13870d52109e22bae25f70888
oai_identifier_str oai:ria.ua.pt:10773/25129
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Aprendizagem automática aplicada à condução de um veículo com direção AckermannAprendizagem AutomáticaAprendizagem por ReforçoAprendizagem SupervisionadaCondução AutónomaNos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.In the last years, there has been a great increase in the area of Artificial Intelligence, mostly because of Machine Learning. This growth is due to higher processing power of current computers, which allows the implementation of already designed algorithms, and to the research and development of new ones. These algorithms allow the execution of tasks difficult to describe directly by programmers. Learning is based on data sets created by humans, or by the algorithms themselves, using a trial and error approach. Autonomous driving is one of the areas where machine learning algorithms have been used, with many of the advances in this area being a result of its use. The ROTA is a small robotic vehicle used in research and teaching of autonomous driving algorithms, that participates in the Portuguese Robotics Open. The competing scenario corresponds to a track with strong similarities to a conventional road, containing obstacles, traffic signs and parking areas. Until the beginning of this dissertation, the various tasks that the vehicle had to carry out were coded directly by the programmer. The objective of this dissertation was to apply deep learning tecniques in the implementation of the driving module, responsible for keeping the vehicle within the lane. The aim was to apply both supervised learning and reinforcement learning techniques. For supervised learning, a convolutional neural network was chosen, having as input a region of interest of the road image captured by a camera mounted on the front of the vehicle and as output the angular velocity to be applied to control the movement. The training data set was obtained by manually controlling the movement of the vehicle with the help of a command and storing the images captured by the camera and the angular velocities given by the human. The data gathering was performed in already existing simulation environment of the vehicle and track. The trained network showed a good performance both in the simulation environment and with the real vehicle on the real track during Robotica 2018. For reinforcement learning, two algorithms were chosen: DDQN and DDPG. To train these algorithms it was necessary to make changes in the simulation environment in order to allow interaction. The various algorithms developed were evaluated and a comparative analysis is presented. The results achieved using the DDQN algorithm were better than those achieved with DDPG, and it was possible to drive in the simulation environment despite of some oscillations and partially exiting the lane a few times.2019-01-16T13:20:39Z2018-01-01T00:00:00Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/25129TID:202234126porRodrigues, João Gabriel das Nevesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:48:58Zoai:ria.ua.pt:10773/25129Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:58:32.455318Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
spellingShingle Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
Rodrigues, João Gabriel das Neves
Aprendizagem Automática
Aprendizagem por Reforço
Aprendizagem Supervisionada
Condução Autónoma
title_short Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_full Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_fullStr Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_full_unstemmed Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_sort Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
author Rodrigues, João Gabriel das Neves
author_facet Rodrigues, João Gabriel das Neves
author_role author
dc.contributor.author.fl_str_mv Rodrigues, João Gabriel das Neves
dc.subject.por.fl_str_mv Aprendizagem Automática
Aprendizagem por Reforço
Aprendizagem Supervisionada
Condução Autónoma
topic Aprendizagem Automática
Aprendizagem por Reforço
Aprendizagem Supervisionada
Condução Autónoma
description Nos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.
publishDate 2018
dc.date.none.fl_str_mv 2018-01-01T00:00:00Z
2018
2019-01-16T13:20:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/25129
TID:202234126
url http://hdl.handle.net/10773/25129
identifier_str_mv TID:202234126
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137639632207872