Um agente autônomo baseado em aprendizagem por reforço direcionado à meta

Braga, Arthur Plínio de Souza

Um agente autônomo baseado em aprendizagem por reforço direcionado à meta

Detalhes bibliográficos
Autor(a) principal:	Braga, Arthur Plínio de Souza
Data de Publicação:	1998
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	http://www.teses.usp.br/teses/disponiveis/18/18133/tde-31102017-111839/
Resumo:	Uma meta procurada em inteligência artificial (IA) é o desenvolvimento de mecanismos inteligentes capazes de cumprir com objetivos preestabelecidos, de forma totalmente independente, em ambientes dinâmicos e complexos. Uma recente vertente das pesquisas em IA, os agentes autônomos, vem conseguindo resultados cada vez mais promissores para o cumprimento desta meta. A motivação deste trabalho é a proposição e implementação de um agente que aprenda a executar tarefas, sem a interferência de um tutor, em um ambiente não estruturado. A tarefa prática proposta para testar o agente é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, comportamento reativo, capacidade de melhoria do desempenho e habilidade para gerenciar múltiplos objetivos. O agente proposto também apresenta um desempenho promissor em ambientes cuja estrutura se altera com o tempo, porém diante de certas situações seus comportamentos em tais ambientes tendem a se tornar inconsistentes.

Metadados do item

id	USP_aafe449709a7416fdcedb418648bbcdd
oai_identifier_str	oai:teses.usp.br:tde-31102017-111839
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Um agente autônomo baseado em aprendizagem por reforço direcionado à metaAn autonomous agent based on goal-directed reinforcement learningAgente autônomoAprendizagem por reforçoArtificial intelligenceAutonomous agentComportamento reativoGoal-directed reinforcement learning problemInteligência artificialMobile robot navigationNavegação de robô móvelPlanejamentoPlanningProblema de aprendizagem por reforço direcionada à metaReactive behaviorReinforcement learningTaxa de aprendizagem variávelVariable learning rateUma meta procurada em inteligência artificial (IA) é o desenvolvimento de mecanismos inteligentes capazes de cumprir com objetivos preestabelecidos, de forma totalmente independente, em ambientes dinâmicos e complexos. Uma recente vertente das pesquisas em IA, os agentes autônomos, vem conseguindo resultados cada vez mais promissores para o cumprimento desta meta. A motivação deste trabalho é a proposição e implementação de um agente que aprenda a executar tarefas, sem a interferência de um tutor, em um ambiente não estruturado. A tarefa prática proposta para testar o agente é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, comportamento reativo, capacidade de melhoria do desempenho e habilidade para gerenciar múltiplos objetivos. O agente proposto também apresenta um desempenho promissor em ambientes cuja estrutura se altera com o tempo, porém diante de certas situações seus comportamentos em tais ambientes tendem a se tornar inconsistentes.One of the current goals of research in Artificial Intelligence is the proposition of intelligent entities that are able to reach a particular target in a dynamic and complex environment without help of a tutor. This objective has been becoming reality through the propositions of the autonomous agents. Thus, the main motivation of this work is to propose and implement an autonomous agent that can match the mentioned goals. This agent, a mobile robot, has to navigate in environments which are initially unknown and may have different structures. The agent learns through one of the main reinforcement learning strategies: temporal difference. The proposed autonomous employs a simple learning mechanisms with the following features: learns incrementally from tabula rasa, executes deliberative and reactive planning, improves its performance through interactions with the environment, and manages multiple objectives. The agent presented promising results when moving in a dynamic environment. However, there are situations in which the agent do not follow this last property.Biblioteca Digitais de Teses e Dissertações da USPAraújo, Aluízio Fausto RibeiroBraga, Arthur Plínio de Souza1998-12-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/18/18133/tde-31102017-111839/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-17T16:38:18Zoai:teses.usp.br:tde-31102017-111839Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212018-07-17T16:38:18Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta An autonomous agent based on goal-directed reinforcement learning
title	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
spellingShingle	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta Braga, Arthur Plínio de Souza Agente autônomo Aprendizagem por reforço Artificial intelligence Autonomous agent Comportamento reativo Goal-directed reinforcement learning problem Inteligência artificial Mobile robot navigation Navegação de robô móvel Planejamento Planning Problema de aprendizagem por reforço direcionada à meta Reactive behavior Reinforcement learning Taxa de aprendizagem variável Variable learning rate
title_short	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
title_full	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
title_fullStr	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
title_full_unstemmed	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
title_sort	Um agente autônomo baseado em aprendizagem por reforço direcionado à meta
author	Braga, Arthur Plínio de Souza
author_facet	Braga, Arthur Plínio de Souza
author_role	author
dc.contributor.none.fl_str_mv	Araújo, Aluízio Fausto Ribeiro
dc.contributor.author.fl_str_mv	Braga, Arthur Plínio de Souza
dc.subject.por.fl_str_mv	Agente autônomo Aprendizagem por reforço Artificial intelligence Autonomous agent Comportamento reativo Goal-directed reinforcement learning problem Inteligência artificial Mobile robot navigation Navegação de robô móvel Planejamento Planning Problema de aprendizagem por reforço direcionada à meta Reactive behavior Reinforcement learning Taxa de aprendizagem variável Variable learning rate
topic	Agente autônomo Aprendizagem por reforço Artificial intelligence Autonomous agent Comportamento reativo Goal-directed reinforcement learning problem Inteligência artificial Mobile robot navigation Navegação de robô móvel Planejamento Planning Problema de aprendizagem por reforço direcionada à meta Reactive behavior Reinforcement learning Taxa de aprendizagem variável Variable learning rate
description	Uma meta procurada em inteligência artificial (IA) é o desenvolvimento de mecanismos inteligentes capazes de cumprir com objetivos preestabelecidos, de forma totalmente independente, em ambientes dinâmicos e complexos. Uma recente vertente das pesquisas em IA, os agentes autônomos, vem conseguindo resultados cada vez mais promissores para o cumprimento desta meta. A motivação deste trabalho é a proposição e implementação de um agente que aprenda a executar tarefas, sem a interferência de um tutor, em um ambiente não estruturado. A tarefa prática proposta para testar o agente é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, comportamento reativo, capacidade de melhoria do desempenho e habilidade para gerenciar múltiplos objetivos. O agente proposto também apresenta um desempenho promissor em ambientes cuja estrutura se altera com o tempo, porém diante de certas situações seus comportamentos em tais ambientes tendem a se tornar inconsistentes.
publishDate	1998
dc.date.none.fl_str_mv	1998-12-16
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/18/18133/tde-31102017-111839/
url	http://www.teses.usp.br/teses/disponiveis/18/18133/tde-31102017-111839/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1809091226893287424

Um agente autônomo baseado em aprendizagem por reforço direcionado à meta

Registros relacionados