Dead ends in FOND planning : from theory to practical contributions
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/279192 |
Resumo: | Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND. |
id |
UFRGS-2_47516cc9079afd22a83167a7188cbc6b |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/279192 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Silva, Marco Antônio Chitolina daPereira, André GrahlSchwartzhaupt, Frederico Messa2024-09-26T06:37:31Z2024http://hdl.handle.net/10183/279192001211293Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND.We study Fully-Observable Non-Deterministic (FOND) planning, which models uncertainty through actions with non-deterministic effects. In FOND planning, the objective is to find a policy that, when followed, ensures we will eventually reach a goal state from the initial state, regardless of the outcome of the applied actions. We theoretically study the structure of FOND planning tasks, identifying all the features that can make a task challenging. In this study, we show that the dead-end states of a FOND planning task can be separated into two categories: deterministic and fully non-deterministic. Considering the determinization of the FOND planning task, where all actions are separated into their non-deterministic effects, thus becoming deterministic actions, there is a function that perfectly identifies all states that cannot reach a goal state. Deterministic dead-end states can be identified using this perfect function, while fully non-deterministic cannot. The fact that fully non-deterministic dead-end states cannot be identified by reducing the problem to classical planning makes them particularly noteworthy. More importantly, we conclude this theoretical study by showing that if a FOND planning task is not prohibitively large, then the only way it can be hard is by having fully non-deterministic dead-end states. Finally, we use these new insights to propose a set of new FOND planning domains that are more challenging for the existing state-of-the-art FOND solvers than the domains of the traditional FOND benchmark. Through empirical experiments, we infer that the performance of existing FOND solvers would be substantially improved if they had full knowledge of the fully non-deterministic dead-end states of a FOND planning task.application/pdfengInteligência artificialAprendizado de máquinaHeurísticaPlanejamento não-determinísticoDead ends in FOND planning : from theory to practical contributionsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001211293.pdf.txt001211293.pdf.txtExtracted Texttext/plain134592http://www.lume.ufrgs.br/bitstream/10183/279192/2/001211293.pdf.txt0c7bc46aa3050a3266922849826c66bdMD52ORIGINAL001211293.pdfTexto completo (inglês)application/pdf1442335http://www.lume.ufrgs.br/bitstream/10183/279192/1/001211293.pdffc512835ad86b418e7990964cf1573e0MD5110183/2791922024-09-27 06:35:02.708554oai:www.lume.ufrgs.br:10183/279192Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-09-27T09:35:02Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Dead ends in FOND planning : from theory to practical contributions |
title |
Dead ends in FOND planning : from theory to practical contributions |
spellingShingle |
Dead ends in FOND planning : from theory to practical contributions Silva, Marco Antônio Chitolina da Inteligência artificial Aprendizado de máquina Heurística Planejamento não-determinístico |
title_short |
Dead ends in FOND planning : from theory to practical contributions |
title_full |
Dead ends in FOND planning : from theory to practical contributions |
title_fullStr |
Dead ends in FOND planning : from theory to practical contributions |
title_full_unstemmed |
Dead ends in FOND planning : from theory to practical contributions |
title_sort |
Dead ends in FOND planning : from theory to practical contributions |
author |
Silva, Marco Antônio Chitolina da |
author_facet |
Silva, Marco Antônio Chitolina da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Marco Antônio Chitolina da |
dc.contributor.advisor1.fl_str_mv |
Pereira, André Grahl |
dc.contributor.advisor-co1.fl_str_mv |
Schwartzhaupt, Frederico Messa |
contributor_str_mv |
Pereira, André Grahl Schwartzhaupt, Frederico Messa |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado de máquina Heurística Planejamento não-determinístico |
topic |
Inteligência artificial Aprendizado de máquina Heurística Planejamento não-determinístico |
description |
Neste trabalho, estudamos o planejamento FOND (Fully-Observable Non-Deterministic), o qual modela incerteza através de ações com efeitos não-determinísticos. No planejamento FOND, o objetivo é encontrar uma política, que quando seguida, assegure que eventualmente alcançaremos um estado objetivo a partir do estado inicial, independentemente do resultado das ações aplicadas. Estudamos teoricamente a estrutura das tarefas de planejamento FOND, identificando todos os aspectos que podem tornar uma tarefa desafiadora. Neste estudo, mostramos que os estados sem-saída de uma tarefa FOND podem ser separados em duas categorias: estados sem-saída determinísticos e estados sem-saída totalmente não-determinísticos. Considerando a “determinização” da tarefa de planejamento FOND, onde todas as ações são divididas em seus efeitos não-determinísticos, tornando-se ações determinísticas, temos uma função que identifica perfeitamente todos os estados que não podem alcançar um estado objetivo. Estados sem-saída determinísticos podem ser identificados usando essa função perfeita, enquanto estados sem-saída totalmente não-determinísticos não podem. Isso torna os estados sem-saída totalmente nãodeterminísticos particularmente interessantes. Mais importante, concluímos este estudo teórico mostrando que, se uma tarefa FOND não for proibitivamente grande, então a única maneira dela ser difícil é contendo estados sem-saída totalmente não-determinísticos. Finalmente, utilizamos esses novo conhecimento para propor um conjunto de novos domí- nios de planejamento FOND que são mais desafiadores para os planejadores FOND existentes do que os domínios do benchmark FOND tradicional. Através de experimentos empíricos, inferimos que o desempenho dos planejadores FOND existentes seria substancialmente melhorado se eles tivessem pleno conhecimento dos estados sem-saída totalmente não-determinísticos de uma tarefa FOND. |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-09-26T06:37:31Z |
dc.date.issued.fl_str_mv |
2024 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/279192 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001211293 |
url |
http://hdl.handle.net/10183/279192 |
identifier_str_mv |
001211293 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/279192/2/001211293.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/279192/1/001211293.pdf |
bitstream.checksum.fl_str_mv |
0c7bc46aa3050a3266922849826c66bd fc512835ad86b418e7990964cf1573e0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447372730204160 |