Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço

Detalhes bibliográficos
Autor(a) principal: Ruhe, Maria Eduarda Nothen
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/274094
Resumo: Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional.
id UFRGS-2_23da978ca17e65ac6954b76997ad14d9
oai_identifier_str oai:www.lume.ufrgs.br:10183/274094
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Ruhe, Maria Eduarda NothenFreitas, Edison Pignaton de2024-03-22T05:07:40Z2024http://hdl.handle.net/10183/274094001198628Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional.In applications for exploring unknown regions using robots, there is a great concern that the method used in the projects is not only efficient, but also requires the lowest compu tational cost possible to carry out the task. The most traditional way to solve this problem would be to first map the region using the robots and, as the map of the region is cre ated, based on the knowledge acquired by the robots, decide which direction to follow. However, this type of method, depending on the size of the region and number of robots, significantly increases memory and computational costs. In this way, multi-robot explo ration algorithms that use mapless navigation have gained notoriety in recent years.In this work, we aim to evaluate whether Reinforcement Learning techniques allow efficient ex ploration strategies for applications with multiple robots in unmapped environments. For this, we use the proximal policy optimization method, which is a deep learning algorithm, which has been studied with good results for the mapless exploration problem. We also focus on how the number of robots modifies the quality of the results using the same learning method. To achieve this, communication structures were created between the robots so that the increase in the number of robots does not cause a significant increase in the cost of memory or computational processing.application/pdfporRobótica móvelRobosAprendizagem por reforçoAprendizagem profundaMulti-Robot SystemsUn known environment explorationCooperative explorationAvaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforçoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001198628.pdf.txt001198628.pdf.txtExtracted Texttext/plain79281http://www.lume.ufrgs.br/bitstream/10183/274094/2/001198628.pdf.txt92778a403a008aabfc865ac8926a1c0bMD52ORIGINAL001198628.pdfTexto completoapplication/pdf5931859http://www.lume.ufrgs.br/bitstream/10183/274094/1/001198628.pdf279c9dfee78d25fe71a1fb63cae34343MD5110183/2740942024-03-23 05:01:52.717579oai:www.lume.ufrgs.br:10183/274094Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-03-23T08:01:52Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
title Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
spellingShingle Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
Ruhe, Maria Eduarda Nothen
Robótica móvel
Robos
Aprendizagem por reforço
Aprendizagem profunda
Multi-Robot Systems
Un known environment exploration
Cooperative exploration
title_short Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
title_full Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
title_fullStr Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
title_full_unstemmed Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
title_sort Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
author Ruhe, Maria Eduarda Nothen
author_facet Ruhe, Maria Eduarda Nothen
author_role author
dc.contributor.author.fl_str_mv Ruhe, Maria Eduarda Nothen
dc.contributor.advisor1.fl_str_mv Freitas, Edison Pignaton de
contributor_str_mv Freitas, Edison Pignaton de
dc.subject.por.fl_str_mv Robótica móvel
Robos
Aprendizagem por reforço
Aprendizagem profunda
topic Robótica móvel
Robos
Aprendizagem por reforço
Aprendizagem profunda
Multi-Robot Systems
Un known environment exploration
Cooperative exploration
dc.subject.eng.fl_str_mv Multi-Robot Systems
Un known environment exploration
Cooperative exploration
description Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-03-22T05:07:40Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/274094
dc.identifier.nrb.pt_BR.fl_str_mv 001198628
url http://hdl.handle.net/10183/274094
identifier_str_mv 001198628
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/274094/2/001198628.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/274094/1/001198628.pdf
bitstream.checksum.fl_str_mv 92778a403a008aabfc865ac8926a1c0b
279c9dfee78d25fe71a1fb63cae34343
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224680257880064