Dead ends in FOND planning : from theory to practical contributions

Detalhes bibliográficos
Autor(a) principal: Silva, Marco Antônio Chitolina da
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/279192
Resumo: Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND.
id UFRGS-2_47516cc9079afd22a83167a7188cbc6b
oai_identifier_str oai:www.lume.ufrgs.br:10183/279192
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Silva, Marco Antônio Chitolina daPereira, André GrahlSchwartzhaupt, Frederico Messa2024-09-26T06:37:31Z2024http://hdl.handle.net/10183/279192001211293Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND.We study Fully-Observable Non-Deterministic (FOND) planning, which models uncertainty through actions with non-deterministic effects. In FOND planning, the objective is to find a policy that, when followed, ensures we will eventually reach a goal state from the initial state, regardless of the outcome of the applied actions. We theoretically study the structure of FOND planning tasks, identifying all the features that can make a task challenging. In this study, we show that the dead-end states of a FOND planning task can be separated into two categories: deterministic and fully non-deterministic. Considering the determinization of the FOND planning task, where all actions are separated into their non-deterministic effects, thus becoming deterministic actions, there is a function that perfectly identifies all states that cannot reach a goal state. Deterministic dead-end states can be identified using this perfect function, while fully non-deterministic cannot. The fact that fully non-deterministic dead-end states cannot be identified by reducing the problem to classical planning makes them particularly noteworthy. More importantly, we conclude this theoretical study by showing that if a FOND planning task is not prohibitively large, then the only way it can be hard is by having fully non-deterministic dead-end states. Finally, we use these new insights to propose a set of new FOND planning domains that are more challenging for the existing state-of-the-art FOND solvers than the domains of the traditional FOND benchmark. Through empirical experiments, we infer that the performance of existing FOND solvers would be substantially improved if they had full knowledge of the fully non-deterministic dead-end states of a FOND planning task.application/pdfengInteligência artificialAprendizado de máquinaHeurísticaPlanejamento não-determinísticoDead ends in FOND planning : from theory to practical contributionsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001211293.pdf.txt001211293.pdf.txtExtracted Texttext/plain134592http://www.lume.ufrgs.br/bitstream/10183/279192/2/001211293.pdf.txt0c7bc46aa3050a3266922849826c66bdMD52ORIGINAL001211293.pdfTexto completo (inglês)application/pdf1442335http://www.lume.ufrgs.br/bitstream/10183/279192/1/001211293.pdffc512835ad86b418e7990964cf1573e0MD5110183/2791922024-09-27 06:35:02.708554oai:www.lume.ufrgs.br:10183/279192Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-09-27T09:35:02Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Dead ends in FOND planning : from theory to practical contributions
title Dead ends in FOND planning : from theory to practical contributions
spellingShingle Dead ends in FOND planning : from theory to practical contributions
Silva, Marco Antônio Chitolina da
Inteligência artificial
Aprendizado de máquina
Heurística
Planejamento não-determinístico
title_short Dead ends in FOND planning : from theory to practical contributions
title_full Dead ends in FOND planning : from theory to practical contributions
title_fullStr Dead ends in FOND planning : from theory to practical contributions
title_full_unstemmed Dead ends in FOND planning : from theory to practical contributions
title_sort Dead ends in FOND planning : from theory to practical contributions
author Silva, Marco Antônio Chitolina da
author_facet Silva, Marco Antônio Chitolina da
author_role author
dc.contributor.author.fl_str_mv Silva, Marco Antônio Chitolina da
dc.contributor.advisor1.fl_str_mv Pereira, André Grahl
dc.contributor.advisor-co1.fl_str_mv Schwartzhaupt, Frederico Messa
contributor_str_mv Pereira, André Grahl
Schwartzhaupt, Frederico Messa
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado de máquina
Heurística
Planejamento não-determinístico
topic Inteligência artificial
Aprendizado de máquina
Heurística
Planejamento não-determinístico
description Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-09-26T06:37:31Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/279192
dc.identifier.nrb.pt_BR.fl_str_mv 001211293
url http://hdl.handle.net/10183/279192
identifier_str_mv 001211293
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/279192/2/001211293.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/279192/1/001211293.pdf
bitstream.checksum.fl_str_mv 0c7bc46aa3050a3266922849826c66bd
fc512835ad86b418e7990964cf1573e0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447372730204160