Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2002 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do ITA |
Texto Completo: | http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487 |
Resumo: | Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos. |
id |
ITA_41f04def8dacbafea32a96df79ca045b |
---|---|
oai_identifier_str |
oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2487 |
network_acronym_str |
ITA |
network_name_str |
Biblioteca Digital de Teses e Dissertações do ITA |
spelling |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial.Redes neuraisAprendizagemAlgoritmosRobôsAvaliação de desempenhoCinemáticaInteligência artificialComputaçãoAlgoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos. Instituto Tecnológico de AeronáuticaCarlos Henrique Costa RibeiroSildomar Takahashi Monteiro2002-00-00info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:04:48Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2487http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:39:16.098Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue |
dc.title.none.fl_str_mv |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
title |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
spellingShingle |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. Sildomar Takahashi Monteiro Redes neurais Aprendizagem Algoritmos Robôs Avaliação de desempenho Cinemática Inteligência artificial Computação |
title_short |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
title_full |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
title_fullStr |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
title_full_unstemmed |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
title_sort |
Estudo de desempenho de algoritmos de aprendizagem sob condições de ambigüidade sensorial. |
author |
Sildomar Takahashi Monteiro |
author_facet |
Sildomar Takahashi Monteiro |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carlos Henrique Costa Ribeiro |
dc.contributor.author.fl_str_mv |
Sildomar Takahashi Monteiro |
dc.subject.por.fl_str_mv |
Redes neurais Aprendizagem Algoritmos Robôs Avaliação de desempenho Cinemática Inteligência artificial Computação |
topic |
Redes neurais Aprendizagem Algoritmos Robôs Avaliação de desempenho Cinemática Inteligência artificial Computação |
dc.description.none.fl_txt_mv |
Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos. |
description |
Algoritmos de aprendizagem autônoma têm sido propostos para lidar com a questão de como um agente autônomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porém, apenas em simulação, o que freqüentemente leva a críticas desfavoráveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real são ignorados, dificultando a análise dos algoritmos sob condições suscetíveis ao problema. A proposta desta dissertação é analisar a sensibilidade de tais algoritmos a situações de ambigüidade de estados comumente produzidas pela baixa capacidade sensorial de robôs móveis. Tal sensibilidade é produzida pela quebra de uma condição teórica (condição de Markov) importante para garantia de convergência de tais algoritmos, mas as conseqüências práticas desta violação sobre sistemas reais não estão bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiências foram realizadas em simulação e em sistemas reais utilizando dois robôs: o mini-robô Khepera e o robô Magellan. Durante os experimentos com o Magellan, implementou-se um método para gerar mapas cognitivos do ambiente com resolução variável, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatório nos sistemas reais, apesar de perder um pouco a sua eficiência devido à ambigüidade dos estados, proveniente de características inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parâmetros da experiência. O método para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliação adequada dos algoritmos. |
publishDate |
2002 |
dc.date.none.fl_str_mv |
2002-00-00 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis |
status_str |
publishedVersion |
format |
masterThesis |
dc.identifier.uri.fl_str_mv |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487 |
url |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2487 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do ITA instname:Instituto Tecnológico de Aeronáutica instacron:ITA |
reponame_str |
Biblioteca Digital de Teses e Dissertações do ITA |
collection |
Biblioteca Digital de Teses e Dissertações do ITA |
instname_str |
Instituto Tecnológico de Aeronáutica |
instacron_str |
ITA |
institution |
ITA |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica |
repository.mail.fl_str_mv |
|
subject_por_txtF_mv |
Redes neurais Aprendizagem Algoritmos Robôs Avaliação de desempenho Cinemática Inteligência artificial Computação |
_version_ |
1706809285749506048 |