Aprendizagem automática aplicada à condução de um veículo com direção Ackermann

Rodrigues, João Gabriel das Neves

Aprendizagem automática aplicada à condução de um veículo com direção Ackermann

Detalhes bibliográficos
Autor(a) principal:	Rodrigues, João Gabriel das Neves
Data de Publicação:	2018
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10773/25129
Resumo:	Nos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.

Metadados do item

id	RCAP_f38fadb13870d52109e22bae25f70888
oai_identifier_str	oai:ria.ua.pt:10773/25129
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Aprendizagem automática aplicada à condução de um veículo com direção AckermannAprendizagem AutomáticaAprendizagem por ReforçoAprendizagem SupervisionadaCondução AutónomaNos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.In the last years, there has been a great increase in the area of Artificial Intelligence, mostly because of Machine Learning. This growth is due to higher processing power of current computers, which allows the implementation of already designed algorithms, and to the research and development of new ones. These algorithms allow the execution of tasks difficult to describe directly by programmers. Learning is based on data sets created by humans, or by the algorithms themselves, using a trial and error approach. Autonomous driving is one of the areas where machine learning algorithms have been used, with many of the advances in this area being a result of its use. The ROTA is a small robotic vehicle used in research and teaching of autonomous driving algorithms, that participates in the Portuguese Robotics Open. The competing scenario corresponds to a track with strong similarities to a conventional road, containing obstacles, traffic signs and parking areas. Until the beginning of this dissertation, the various tasks that the vehicle had to carry out were coded directly by the programmer. The objective of this dissertation was to apply deep learning tecniques in the implementation of the driving module, responsible for keeping the vehicle within the lane. The aim was to apply both supervised learning and reinforcement learning techniques. For supervised learning, a convolutional neural network was chosen, having as input a region of interest of the road image captured by a camera mounted on the front of the vehicle and as output the angular velocity to be applied to control the movement. The training data set was obtained by manually controlling the movement of the vehicle with the help of a command and storing the images captured by the camera and the angular velocities given by the human. The data gathering was performed in already existing simulation environment of the vehicle and track. The trained network showed a good performance both in the simulation environment and with the real vehicle on the real track during Robotica 2018. For reinforcement learning, two algorithms were chosen: DDQN and DDPG. To train these algorithms it was necessary to make changes in the simulation environment in order to allow interaction. The various algorithms developed were evaluated and a comparative analysis is presented. The results achieved using the DDQN algorithm were better than those achieved with DDPG, and it was possible to drive in the simulation environment despite of some oscillations and partially exiting the lane a few times.2019-01-16T13:20:39Z2018-01-01T00:00:00Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/25129TID:202234126porRodrigues, João Gabriel das Nevesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:48:58Zoai:ria.ua.pt:10773/25129Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:58:32.455318Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
spellingShingle	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann Rodrigues, João Gabriel das Neves Aprendizagem Automática Aprendizagem por Reforço Aprendizagem Supervisionada Condução Autónoma
title_short	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_full	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_fullStr	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_full_unstemmed	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
title_sort	Aprendizagem automática aplicada à condução de um veículo com direção Ackermann
author	Rodrigues, João Gabriel das Neves
author_facet	Rodrigues, João Gabriel das Neves
author_role	author
dc.contributor.author.fl_str_mv	Rodrigues, João Gabriel das Neves
dc.subject.por.fl_str_mv	Aprendizagem Automática Aprendizagem por Reforço Aprendizagem Supervisionada Condução Autónoma
topic	Aprendizagem Automática Aprendizagem por Reforço Aprendizagem Supervisionada Condução Autónoma
description	Nos últimos anos, tem havido um grande crescimento na área da Inteligência Artificial, principalmente por causa da aprendizagem automática. Esse crescimento é devido ao maior poder de processamento dos computadores atuais, o que permite a implementação de algoritmos já projetados, e à pesquisa e desenvolvimento de novos algoritmos. Esses algoritmos permitem a execução de tarefas difíceis de descrever diretamente pelos programadores. A aprendizagem é baseada em conjuntos de dados criados por seres humanos ou pelos próprios algoritmos, usando uma abordagem de tentativa e erro. A condução autónoma é uma das áreas em que os algoritmos de aprendizagem automática têm sido utilizados, com muitos dos avanços nessa área sendo resultado do seu uso. O ROTA é um veículo robótico de pequenas dimensões usado para investigação e ensino de algoritmos de condução autónoma, que participa no Festival Nacional de Robótica. O cenário de atuação do veículo corresponde a uma pista com semelhanças marcantes a uma estrada convencional, contendo obstáculos, sinais de trânsito e zonas de estacionamento. Até ao início desta dissertação, as várias tarefas que o veículo tinha que autonomamente realizar eram codificadas diretamente pelo programador. O objetivo desta dissertação foi o de aplicar aprendizagem automática na implementação do módulo de condução, responsável por manter o veículo dentro da faixa de rodagem. Pretendia-se a aplicação de técnicas de aprendizagem supervisionada e de aprendizagem por reforço. Para a aprendizagem supervisionada, optou-se por uma rede neuronal convolucional, tendo como entrada uma região de interesse da imagem da estrada captada por uma câmara montada na parte frontal do veículo e como saída a velocidade angular a aplicar para controlo do movimento. O conjunto de dados de treino foi obtido controlando manualmente o movimento do veículo com a ajuda de um comando e armazenando as imagens captadas pela câmara e as velocidades angulares dadas pelo humano. A recolha foi realizada num ambiente de simulação do veículo e da pista já existente. A rede treinada mostrou um bom desempenho quer no ambiente de simulação, quer com o veículo real na pista real durante o Robotica 2018. Para a aprendizagem por reforço, escolheram-se dois algoritmos: o DDQN e o DDPG. Para treinar estes algoritmos foi necessário proceder a alterações no ambiente de simulação de modo a permitir a interação. Os vários algoritmos desenvolvidos foram avaliados, fazendo-se uma análise comparativa. Os resultados alcançados com o algoritmo DDQN foram melhores que os alcançados com o DDPG, tendo sido possível conduzir no ambiente de simulaç ão, embora com algumas oscilações e saídas parciais de pista.
publishDate	2018
dc.date.none.fl_str_mv	2018-01-01T00:00:00Z 2018 2019-01-16T13:20:39Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10773/25129 TID:202234126
url	http://hdl.handle.net/10773/25129
identifier_str_mv	TID:202234126
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137639632207872

Aprendizagem automática aplicada à condução de um veículo com direção Ackermann

Registros relacionados