Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis

Detalhes bibliográficos
Autor(a) principal: Gedson Faria
Data de Publicação: 2000
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/D.55.2020.tde-19022020-091603
Resumo: O problema de aprendizado com robôs é essencialmente fazer com que o robô execute tarefas sem a necessidade de programá-los explicitamente. Nos últimos anos, Aprendizado de Máquina, um subcampo de Inteligência Artificial, tem procurado substituir programação explicita pelo processo de ensinar uma tarefa. O Aprendizado com Reforço é um dos paradigmas do aprendizado não-supervisionado, podendo ser visto como uma forma de ensinar o robô a realizar uma tarefa sem especificar previamente como realizá-la. O problema de aprendizado com reforço pode ser modelado como: um conjunto de estados do ambiente, um conjunto de ações e um conjunto de recompensas Neste trabalho explora-se o potencial dos principais algoritmos de aprendizado com reforço: Q-learning, R-learning e H-learning. Desta forma, foram comparados métodos \"independentes de modelo\" e \"baseados em modelo\", verificando a eficiência de cada algoritmo para a tarefa de navegação em um ambiente dinâmico contendo obstáculos. Além disso, este trabalho propõe um método de navegação baseado em sensores, chamado R-learning, o qual incorpora conceitos de lógica fuzzy ao algoritmo R-learning para a navegação de robôs móveis em ambientes desconhecidos. Foi realizada uma aplicação que consiste em ensinar o robô a encontrar pequenos objetos. Para isto, um conjunto de estados foi mapeado através de conceitos de força de repulsão e para navegação foi utilizado o algoritmo R-learning. O robô mostrou ter um comportamento satisfatório ao realizar esta tarefa.
id USP_a5034691da3b477f14dc8dafd202ecb5
oai_identifier_str oai:teses.usp.br:tde-19022020-091603
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis Not available 2000-06-15Roseli Aparecida Francelin RomeroAnna Helena Reali CostaPaulo Rogério PolitanoGedson FariaUniversidade de São PauloCiências da Computação e Matemática ComputacionalUSPBR Não disponível Not available O problema de aprendizado com robôs é essencialmente fazer com que o robô execute tarefas sem a necessidade de programá-los explicitamente. Nos últimos anos, Aprendizado de Máquina, um subcampo de Inteligência Artificial, tem procurado substituir programação explicita pelo processo de ensinar uma tarefa. O Aprendizado com Reforço é um dos paradigmas do aprendizado não-supervisionado, podendo ser visto como uma forma de ensinar o robô a realizar uma tarefa sem especificar previamente como realizá-la. O problema de aprendizado com reforço pode ser modelado como: um conjunto de estados do ambiente, um conjunto de ações e um conjunto de recompensas Neste trabalho explora-se o potencial dos principais algoritmos de aprendizado com reforço: Q-learning, R-learning e H-learning. Desta forma, foram comparados métodos \"independentes de modelo\" e \"baseados em modelo\", verificando a eficiência de cada algoritmo para a tarefa de navegação em um ambiente dinâmico contendo obstáculos. Além disso, este trabalho propõe um método de navegação baseado em sensores, chamado R-learning, o qual incorpora conceitos de lógica fuzzy ao algoritmo R-learning para a navegação de robôs móveis em ambientes desconhecidos. Foi realizada uma aplicação que consiste em ensinar o robô a encontrar pequenos objetos. Para isto, um conjunto de estados foi mapeado através de conceitos de força de repulsão e para navegação foi utilizado o algoritmo R-learning. O robô mostrou ter um comportamento satisfatório ao realizar esta tarefa. The problem of robot learning is essentially one of getting robots to do tasks without the need for explicitly programming them. Machine learning is a sub-area of artificial intelligence (AI), whose ultimate goal is to replace explicit programming by teaching. Reinforcement Learning (RL) is an unsupervised learning paradigm and could be seen as a way of prograrnming agents by reward and punishrnent without specify how the task is to be achieved. Formally, the RL model consists of a discrete set of environment states, a discrete set of agent actions and a set of scalar reinforcement signals. In this work, the performance of the most important reinforcement learning algorithms: Q-learning, R-learning, H-learning is investigated. In this way, model-free and model-based are compared, to show the efficiency of each algorithm in the navigation task avoiding obstacles. Furthermore, this work proposes a sensor-based navigation method, called R-learning, which incorporates fuzzy logic into the R-learning algorithm for navigation of mobile robots in uncertain environment. An application consisting of teaching the robots to find small objects in a corridor is realized. For this, a state set mapping is done through force field concepts and for the navigation R-leaning algorithm has been used. The robot showed to have behavior satisfactory in the performing this task. https://doi.org/10.11606/D.55.2020.tde-19022020-091603info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:22:41Zoai:teses.usp.br:tde-19022020-091603Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T12:53:53.452149Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
dc.title.alternative.en.fl_str_mv Not available
title Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
spellingShingle Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
Gedson Faria
title_short Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
title_full Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
title_fullStr Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
title_full_unstemmed Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
title_sort Explorando o Potencial de Algoritmos de Aprendizado com Reforço em Robôs Móveis
author Gedson Faria
author_facet Gedson Faria
author_role author
dc.contributor.advisor1.fl_str_mv Roseli Aparecida Francelin Romero
dc.contributor.referee1.fl_str_mv Anna Helena Reali Costa
dc.contributor.referee2.fl_str_mv Paulo Rogério Politano
dc.contributor.author.fl_str_mv Gedson Faria
contributor_str_mv Roseli Aparecida Francelin Romero
Anna Helena Reali Costa
Paulo Rogério Politano
description O problema de aprendizado com robôs é essencialmente fazer com que o robô execute tarefas sem a necessidade de programá-los explicitamente. Nos últimos anos, Aprendizado de Máquina, um subcampo de Inteligência Artificial, tem procurado substituir programação explicita pelo processo de ensinar uma tarefa. O Aprendizado com Reforço é um dos paradigmas do aprendizado não-supervisionado, podendo ser visto como uma forma de ensinar o robô a realizar uma tarefa sem especificar previamente como realizá-la. O problema de aprendizado com reforço pode ser modelado como: um conjunto de estados do ambiente, um conjunto de ações e um conjunto de recompensas Neste trabalho explora-se o potencial dos principais algoritmos de aprendizado com reforço: Q-learning, R-learning e H-learning. Desta forma, foram comparados métodos \"independentes de modelo\" e \"baseados em modelo\", verificando a eficiência de cada algoritmo para a tarefa de navegação em um ambiente dinâmico contendo obstáculos. Além disso, este trabalho propõe um método de navegação baseado em sensores, chamado R-learning, o qual incorpora conceitos de lógica fuzzy ao algoritmo R-learning para a navegação de robôs móveis em ambientes desconhecidos. Foi realizada uma aplicação que consiste em ensinar o robô a encontrar pequenos objetos. Para isto, um conjunto de estados foi mapeado através de conceitos de força de repulsão e para navegação foi utilizado o algoritmo R-learning. O robô mostrou ter um comportamento satisfatório ao realizar esta tarefa.
publishDate 2000
dc.date.issued.fl_str_mv 2000-06-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/D.55.2020.tde-19022020-091603
url https://doi.org/10.11606/D.55.2020.tde-19022020-091603
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Ciências da Computação e Matemática Computacional
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794502853772967936