Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/274094 |
Resumo: | Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional. |
id |
UFRGS-2_23da978ca17e65ac6954b76997ad14d9 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/274094 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Ruhe, Maria Eduarda NothenFreitas, Edison Pignaton de2024-03-22T05:07:40Z2024http://hdl.handle.net/10183/274094001198628Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional.In applications for exploring unknown regions using robots, there is a great concern that the method used in the projects is not only efficient, but also requires the lowest compu tational cost possible to carry out the task. The most traditional way to solve this problem would be to first map the region using the robots and, as the map of the region is cre ated, based on the knowledge acquired by the robots, decide which direction to follow. However, this type of method, depending on the size of the region and number of robots, significantly increases memory and computational costs. In this way, multi-robot explo ration algorithms that use mapless navigation have gained notoriety in recent years.In this work, we aim to evaluate whether Reinforcement Learning techniques allow efficient ex ploration strategies for applications with multiple robots in unmapped environments. For this, we use the proximal policy optimization method, which is a deep learning algorithm, which has been studied with good results for the mapless exploration problem. We also focus on how the number of robots modifies the quality of the results using the same learning method. To achieve this, communication structures were created between the robots so that the increase in the number of robots does not cause a significant increase in the cost of memory or computational processing.application/pdfporRobótica móvelRobosAprendizagem por reforçoAprendizagem profundaMulti-Robot SystemsUn known environment explorationCooperative explorationAvaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforçoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001198628.pdf.txt001198628.pdf.txtExtracted Texttext/plain79281http://www.lume.ufrgs.br/bitstream/10183/274094/2/001198628.pdf.txt92778a403a008aabfc865ac8926a1c0bMD52ORIGINAL001198628.pdfTexto completoapplication/pdf5931859http://www.lume.ufrgs.br/bitstream/10183/274094/1/001198628.pdf279c9dfee78d25fe71a1fb63cae34343MD5110183/2740942024-03-23 05:01:52.717579oai:www.lume.ufrgs.br:10183/274094Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-03-23T08:01:52Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
title |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
spellingShingle |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço Ruhe, Maria Eduarda Nothen Robótica móvel Robos Aprendizagem por reforço Aprendizagem profunda Multi-Robot Systems Un known environment exploration Cooperative exploration |
title_short |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
title_full |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
title_fullStr |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
title_full_unstemmed |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
title_sort |
Avaliação da navegação sem mapeamento para exploração de ambientes internos desconhecidos por múltiplos robôs móveis autônomos usando Aprendizagem por Reforço |
author |
Ruhe, Maria Eduarda Nothen |
author_facet |
Ruhe, Maria Eduarda Nothen |
author_role |
author |
dc.contributor.author.fl_str_mv |
Ruhe, Maria Eduarda Nothen |
dc.contributor.advisor1.fl_str_mv |
Freitas, Edison Pignaton de |
contributor_str_mv |
Freitas, Edison Pignaton de |
dc.subject.por.fl_str_mv |
Robótica móvel Robos Aprendizagem por reforço Aprendizagem profunda |
topic |
Robótica móvel Robos Aprendizagem por reforço Aprendizagem profunda Multi-Robot Systems Un known environment exploration Cooperative exploration |
dc.subject.eng.fl_str_mv |
Multi-Robot Systems Un known environment exploration Cooperative exploration |
description |
Em aplicações de exploração de regiões desconhecidas com utilização de robôs, existe uma grande preocupação de que o método utilizado nos projetos não seja apenas eficiente, mas também demande o menor custo computacional para realizar a tarefa. A maneira mais tradicional de resolver esse problema seria primeiro mapear a região utilizando os robôs e, conforme o mapa da região é criado, a partir do conhecimento adquirido pelos robôs decidir qual direção deve seguir. Porém, esse tipo de método conforme o tamanho da região e número de robôs aumentam significamente o custo de memória e computacional. Desta forma, algoritmos de exploração com multi-robôs de forma que não necessite de um mapa ganharam notoriedade nos últimos anos. Neste trabalho, temos como objetivo avaliar se as técnicas de Aprendizado por Reforço permitem estratégias de exploração eficientes para aplicações com múltiplos robôs em ambientes não mapeados. Para isso, utilizamos o método otimização de política proximal, que é um algoritmos de aprendizado profundo, na qual resultou em bom resultados para o problema de exploração sem mapa. Também focamos de como o número de robôs modifica a qualidade dos resulta dos utilizando o mesmo método de aprendizado. Para isso, foram criados estruturas de comunicações entre os robôs de modo que o aumento do número de robôs, não cause um aumento significativo no custo de memória ou processamento computacional. |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-03-22T05:07:40Z |
dc.date.issued.fl_str_mv |
2024 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/274094 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001198628 |
url |
http://hdl.handle.net/10183/274094 |
identifier_str_mv |
001198628 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/274094/2/001198628.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/274094/1/001198628.pdf |
bitstream.checksum.fl_str_mv |
92778a403a008aabfc865ac8926a1c0b 279c9dfee78d25fe71a1fb63cae34343 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224680257880064 |