Understanding sample generation strategies for learning heuristic functions in classical planning

Bettker, Rafael Vales

Understanding sample generation strategies for learning heuristic functions in classical planning

Detalhes bibliográficos
Autor(a) principal:	Bettker, Rafael Vales
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo:	http://hdl.handle.net/10183/265193
Resumo:	Funções heurísticas são essenciais para guiar algoritmos de busca na resolução de tarefas de planejamento. Nós estudamos o problema de aprender boas funções heurísticas para tarefas de planejamento clássico usando redes neurais baseadas em amostras que são estados acompanhados de suas estimativas de custo-para-objetivo. É conhecido que a qualidade do modelo aprendido depende da qualidade dos dados de treinamento. Nosso objetivo principal é entender melhor a influência das estratégias de geração de amostras no desempenho do greedy best-first search guiado por uma função heurística aprendida. Em um conjunto de experimentos controlados, descobrimos que dois fatores principais determinam a qualidade da heurística aprendida: a distribuição de amostras no espaço de estados e a qualidade das estimativas de custo-para-objetivo. Esses dois fatores são inter dependentes: ter estimativas ótimas de custo-para-objetivo é insuficiente se as amostras não estiverem bem distribuídas ao longo do espaço de estados. Nós estudamos os efeitos de restringir as amostras para incluir apenas estados que poderiam ser visitados ao resolver uma determinada tarefa e os efeitos de adicionar amostras com altos valores de estima tivas. Com base em nossas descobertas, propomos estratégias práticas para melhorar a qualidade das heurísticas aprendidas: três estratégias que visam gerar estados mais repre sentativos e duas estratégias que melhoram as estimativas de custo-para-objetivo. Nossa heurística resultante da rede neural possui uma cobertura maior do que uma heurística de satisficing básica. Em comparação com uma heurística baseline aprendida, nossa melhor heurística de rede neural quase dobra a cobertura média e aumenta para alguns domínios em mais de seis vezes.

Metadados do item

id	URGS_47abd218d4da0b33bb0dea96505f4003
oai_identifier_str	oai:www.lume.ufrgs.br:10183/265193
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str	1853
spelling	Bettker, Rafael ValesPereira, André Grahl2023-09-26T03:35:02Z2023http://hdl.handle.net/10183/265193001177244Funções heurísticas são essenciais para guiar algoritmos de busca na resolução de tarefas de planejamento. Nós estudamos o problema de aprender boas funções heurísticas para tarefas de planejamento clássico usando redes neurais baseadas em amostras que são estados acompanhados de suas estimativas de custo-para-objetivo. É conhecido que a qualidade do modelo aprendido depende da qualidade dos dados de treinamento. Nosso objetivo principal é entender melhor a influência das estratégias de geração de amostras no desempenho do greedy best-first search guiado por uma função heurística aprendida. Em um conjunto de experimentos controlados, descobrimos que dois fatores principais determinam a qualidade da heurística aprendida: a distribuição de amostras no espaço de estados e a qualidade das estimativas de custo-para-objetivo. Esses dois fatores são inter dependentes: ter estimativas ótimas de custo-para-objetivo é insuficiente se as amostras não estiverem bem distribuídas ao longo do espaço de estados. Nós estudamos os efeitos de restringir as amostras para incluir apenas estados que poderiam ser visitados ao resolver uma determinada tarefa e os efeitos de adicionar amostras com altos valores de estima tivas. Com base em nossas descobertas, propomos estratégias práticas para melhorar a qualidade das heurísticas aprendidas: três estratégias que visam gerar estados mais repre sentativos e duas estratégias que melhoram as estimativas de custo-para-objetivo. Nossa heurística resultante da rede neural possui uma cobertura maior do que uma heurística de satisficing básica. Em comparação com uma heurística baseline aprendida, nossa melhor heurística de rede neural quase dobra a cobertura média e aumenta para alguns domínios em mais de seis vezes.Heuristic functions are essential in guiding search algorithms to solve planning tasks. We study the problem of learning good heuristic functions for classical planning tasks with neural networks based on samples that are states with their cost-to-goal estimates. It is well known that the learned model quality depends on the quality of training data. Our main goal is to better understand the influence of sample generation strategies on the performance of a greedy best-first search guided by a learned heuristic function. In a set of controlled experiments, we find that two main factors determine the quality of the learned heuristic: the distribution of samples in the state space and the quality of the cost-to-goal estimates. These two factors are interdependent: having perfect cost-to-goal estimates is insufficient if the samples are not well distributed across the state space. We study the effects of restricting samples to only include states that could be visited when solving a given task and the effects of adding samples with high-value estimates. Based on our findings, we propose practical strategies to improve the quality of learned heuristics: three strategies that aim to generate more representative states and two strategies that improve the cost-to-goal estimates. Our resulting neural network heuristic has higher coverage than a basic satisficing heuristic. Compared to a baseline learned heuristic, our best neural network heuristic almost doubles the mean coverage and can increase it for some domains by more than six times.application/pdfengHeurísticaRede neural artificialAprendizado de máquinaClassical planningHeuristic searchSample qualityUnderstanding sample generation strategies for learning heuristic functions in classical planningCompreendendo estratégias de amostragem para aprendizagem de funções heurísticas em planejamento clássico info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001177244.pdf.txt001177244.pdf.txtExtracted Texttext/plain144474http://www.lume.ufrgs.br/bitstream/10183/265193/2/001177244.pdf.txt0c75730287d59f2fdad64ff392fd2a76MD52ORIGINAL001177244.pdfTexto completo (inglês)application/pdf486246http://www.lume.ufrgs.br/bitstream/10183/265193/1/001177244.pdfb6aac8e1c5157f89e0f95b6c6088cb7cMD5110183/2651932024-08-07 06:16:08.165103oai:www.lume.ufrgs.br:10183/265193Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532024-08-07T09:16:08Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Understanding sample generation strategies for learning heuristic functions in classical planning
dc.title.alternative.pt.fl_str_mv	Compreendendo estratégias de amostragem para aprendizagem de funções heurísticas em planejamento clássico
title	Understanding sample generation strategies for learning heuristic functions in classical planning
spellingShingle	Understanding sample generation strategies for learning heuristic functions in classical planning Bettker, Rafael Vales Heurística Rede neural artificial Aprendizado de máquina Classical planning Heuristic search Sample quality
title_short	Understanding sample generation strategies for learning heuristic functions in classical planning
title_full	Understanding sample generation strategies for learning heuristic functions in classical planning
title_fullStr	Understanding sample generation strategies for learning heuristic functions in classical planning
title_full_unstemmed	Understanding sample generation strategies for learning heuristic functions in classical planning
title_sort	Understanding sample generation strategies for learning heuristic functions in classical planning
author	Bettker, Rafael Vales
author_facet	Bettker, Rafael Vales
author_role	author
dc.contributor.author.fl_str_mv	Bettker, Rafael Vales
dc.contributor.advisor1.fl_str_mv	Pereira, André Grahl
contributor_str_mv	Pereira, André Grahl
dc.subject.por.fl_str_mv	Heurística Rede neural artificial Aprendizado de máquina
topic	Heurística Rede neural artificial Aprendizado de máquina Classical planning Heuristic search Sample quality
dc.subject.eng.fl_str_mv	Classical planning Heuristic search Sample quality
description	Funções heurísticas são essenciais para guiar algoritmos de busca na resolução de tarefas de planejamento. Nós estudamos o problema de aprender boas funções heurísticas para tarefas de planejamento clássico usando redes neurais baseadas em amostras que são estados acompanhados de suas estimativas de custo-para-objetivo. É conhecido que a qualidade do modelo aprendido depende da qualidade dos dados de treinamento. Nosso objetivo principal é entender melhor a influência das estratégias de geração de amostras no desempenho do greedy best-first search guiado por uma função heurística aprendida. Em um conjunto de experimentos controlados, descobrimos que dois fatores principais determinam a qualidade da heurística aprendida: a distribuição de amostras no espaço de estados e a qualidade das estimativas de custo-para-objetivo. Esses dois fatores são inter dependentes: ter estimativas ótimas de custo-para-objetivo é insuficiente se as amostras não estiverem bem distribuídas ao longo do espaço de estados. Nós estudamos os efeitos de restringir as amostras para incluir apenas estados que poderiam ser visitados ao resolver uma determinada tarefa e os efeitos de adicionar amostras com altos valores de estima tivas. Com base em nossas descobertas, propomos estratégias práticas para melhorar a qualidade das heurísticas aprendidas: três estratégias que visam gerar estados mais repre sentativos e duas estratégias que melhoram as estimativas de custo-para-objetivo. Nossa heurística resultante da rede neural possui uma cobertura maior do que uma heurística de satisficing básica. Em comparação com uma heurística baseline aprendida, nossa melhor heurística de rede neural quase dobra a cobertura média e aumenta para alguns domínios em mais de seis vezes.
publishDate	2023
dc.date.accessioned.fl_str_mv	2023-09-26T03:35:02Z
dc.date.issued.fl_str_mv	2023
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/265193
dc.identifier.nrb.pt_BR.fl_str_mv	001177244
url	http://hdl.handle.net/10183/265193
identifier_str_mv	001177244
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/265193/2/001177244.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/265193/1/001177244.pdf
bitstream.checksum.fl_str_mv	0c75730287d59f2fdad64ff392fd2a76 b6aac8e1c5157f89e0f95b6c6088cb7c
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1810085629368729600

Understanding sample generation strategies for learning heuristic functions in classical planning

Registros relacionados