Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.

Detalhes bibliográficos
Autor(a) principal: Sildomar Takahashi Monteiro
Data de Publicação: 2002
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do ITA
Texto Completo: http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487
Resumo: Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos.
id ITA_41f04def8dacbafea32a96df79ca045b
oai_identifier_str oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2487
network_acronym_str ITA
network_name_str Biblioteca Digital de Teses e Dissertações do ITA
spelling Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.Redes neuraisAprendizagemAlgoritmosRobôsAvaliação de desempenhoCinemáticaInteligência artificialComputaçãoAlgoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos. Instituto Tecnológico de AeronáuticaCarlos Henrique Costa RibeiroSildomar Takahashi Monteiro2002-00-00info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:04:48Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2487http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:39:16.098Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue
dc.title.none.fl_str_mv Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
title Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
spellingShingle Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
Sildomar Takahashi Monteiro
Redes neurais
Aprendizagem
Algoritmos
Robôs
Avaliação de desempenho
Cinemática
Inteligência artificial
Computação
title_short Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
title_full Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
title_fullStr Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
title_full_unstemmed Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
title_sort Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
author Sildomar Takahashi Monteiro
author_facet Sildomar Takahashi Monteiro
author_role author
dc.contributor.none.fl_str_mv Carlos Henrique Costa Ribeiro
dc.contributor.author.fl_str_mv Sildomar Takahashi Monteiro
dc.subject.por.fl_str_mv Redes neurais
Aprendizagem
Algoritmos
Robôs
Avaliação de desempenho
Cinemática
Inteligência artificial
Computação
topic Redes neurais
Aprendizagem
Algoritmos
Robôs
Avaliação de desempenho
Cinemática
Inteligência artificial
Computação
dc.description.none.fl_txt_mv Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos.
description Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos.
publishDate 2002
dc.date.none.fl_str_mv 2002-00-00
dc.type.driver.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/masterThesis
status_str publishedVersion
format masterThesis
dc.identifier.uri.fl_str_mv http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487
url http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Tecnológico de Aeronáutica
publisher.none.fl_str_mv Instituto Tecnológico de Aeronáutica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do ITA
instname:Instituto Tecnológico de Aeronáutica
instacron:ITA
reponame_str Biblioteca Digital de Teses e Dissertações do ITA
collection Biblioteca Digital de Teses e Dissertações do ITA
instname_str Instituto Tecnológico de Aeronáutica
instacron_str ITA
institution ITA
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica
repository.mail.fl_str_mv
subject_por_txtF_mv Redes neurais
Aprendizagem
Algoritmos
Robôs
Avaliação de desempenho
Cinemática
Inteligência artificial
Computação
_version_ 1706809285749506048