Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas

Detalhes bibliográficos
Autor(a) principal: Vianna, Luis Gustavo Rocha
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113351/
Resumo: Este trabalho trata o problema de planejamento em inteligência artificial, mais especificamente, planejamento probabilístico com variáveis contínuas. Aplicações de planejamento em inteligência artificial, em geral, envolvem recursos contínuos, portanto é necessário que os agentes raciocinem com modelos que representem variáveis contínuas. Uma solução exata, recentemente proposta, para uma classe de problemas de planejamento probabilístico é a programação dinâmica simbólica - PDS, que é capaz de resolver de maneira eficiente problemas com variáveis discretas e contínuas, utilizando manipulação simbólica. Essa técnica resolve problemas com variáveis contínuas manipulando expressões definidas por casos que envolvem essas variáveis para obter a expressão da solução exata. No entanto, a manipulação envolve um aumento no número de casos usados na expressão, de forma que a representação exata das soluções pode se tornar intratavelmente custosa. Neste trabalho, pretendemos adaptar a PDS com uma técnica de aproximação que permite controlar o crescimento da complexidade das expressões em troca de um pequeno erro em seus valores. A maneira como pretendemos simplificar as expressões é baseada em reduzir o número de casos numa expressão simbólica, o que é feito unindo regiões de casos diferentes que apresentam valores próximos. Além disso, a eficiência da PDS pode ser melhorada modificando qual o cálculo usado para obter a expressão da solução. Uma forma de evitar cálculos desnecessários é utilizar a informação do estado inicial e fazer uma busca heurística a partir dele, restringindo a região de valores para os quais precisamos da solução ótima. Assim, pretendemos criar dois novos algoritmos que usam a manipulação simbólica das expressões com variáveis contínuas, adicionando componentes de técnicas recentes para planejamento probabilístico discreto.
id USP_fa6d8eca252e67dd7206de982ea3e9ab
oai_identifier_str oai:teses.usp.br:tde-20230727-113351
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuasApproximate and asynchronous symbolic dynamic programming for Markov decision processes in continuous spacesInteligência ArtificialProgramação DinâmicaEste trabalho trata o problema de planejamento em inteligência artificial, mais especificamente, planejamento probabilístico com variáveis contínuas. Aplicações de planejamento em inteligência artificial, em geral, envolvem recursos contínuos, portanto é necessário que os agentes raciocinem com modelos que representem variáveis contínuas. Uma solução exata, recentemente proposta, para uma classe de problemas de planejamento probabilístico é a programação dinâmica simbólica - PDS, que é capaz de resolver de maneira eficiente problemas com variáveis discretas e contínuas, utilizando manipulação simbólica. Essa técnica resolve problemas com variáveis contínuas manipulando expressões definidas por casos que envolvem essas variáveis para obter a expressão da solução exata. No entanto, a manipulação envolve um aumento no número de casos usados na expressão, de forma que a representação exata das soluções pode se tornar intratavelmente custosa. Neste trabalho, pretendemos adaptar a PDS com uma técnica de aproximação que permite controlar o crescimento da complexidade das expressões em troca de um pequeno erro em seus valores. A maneira como pretendemos simplificar as expressões é baseada em reduzir o número de casos numa expressão simbólica, o que é feito unindo regiões de casos diferentes que apresentam valores próximos. Além disso, a eficiência da PDS pode ser melhorada modificando qual o cálculo usado para obter a expressão da solução. Uma forma de evitar cálculos desnecessários é utilizar a informação do estado inicial e fazer uma busca heurística a partir dele, restringindo a região de valores para os quais precisamos da solução ótima. Assim, pretendemos criar dois novos algoritmos que usam a manipulação simbólica das expressões com variáveis contínuas, adicionando componentes de técnicas recentes para planejamento probabilístico discreto.This work is a study on the planning problem in artificial intelligence, specifically probabilis- tic planning in continuous spaces. The efficient solution of planning problems is a major goal in artificial intelligence and can be applied extensively in autonomous agents. In many applications, the modelled problem contains continuous resources, so that an optimal planner must reason over continuos quantities to obtain appropriate actions. A recent and exact solution is Symbolic Dyna- mic Programming, which extends discrete probabilistic planning solutions to continuous problems by using a symbolic representation of state variables. This solution is interesting because it can find optimal solutions, however it is limited in efficiency because it relies on standard dynamic pro- gramming and doesn\2019t use initial state information or heuristic search. On this work, I will extend Symbolic Dynamic Programming to use more efficient dynamic programming approaches, based on recent solutions for discrete probabilistic planning. A novel planner using symbolic representation and heuristic search is proposed and compared to previous works on relevant continuos scenarios.Biblioteca Digitais de Teses e Dissertações da USPBarros, Leliane Nunes deVianna, Luis Gustavo Rocha2015-05-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113351/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T19:31:05Zoai:teses.usp.br:tde-20230727-113351Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T19:31:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
Approximate and asynchronous symbolic dynamic programming for Markov decision processes in continuous spaces
title Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
spellingShingle Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
Vianna, Luis Gustavo Rocha
Inteligência Artificial
Programação Dinâmica
title_short Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
title_full Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
title_fullStr Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
title_full_unstemmed Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
title_sort Programação dinâmica simbólica aproximada e assíncrona para processos de decisão markovianos com variáveis contínuas
author Vianna, Luis Gustavo Rocha
author_facet Vianna, Luis Gustavo Rocha
author_role author
dc.contributor.none.fl_str_mv Barros, Leliane Nunes de
dc.contributor.author.fl_str_mv Vianna, Luis Gustavo Rocha
dc.subject.por.fl_str_mv Inteligência Artificial
Programação Dinâmica
topic Inteligência Artificial
Programação Dinâmica
description Este trabalho trata o problema de planejamento em inteligência artificial, mais especificamente, planejamento probabilístico com variáveis contínuas. Aplicações de planejamento em inteligência artificial, em geral, envolvem recursos contínuos, portanto é necessário que os agentes raciocinem com modelos que representem variáveis contínuas. Uma solução exata, recentemente proposta, para uma classe de problemas de planejamento probabilístico é a programação dinâmica simbólica - PDS, que é capaz de resolver de maneira eficiente problemas com variáveis discretas e contínuas, utilizando manipulação simbólica. Essa técnica resolve problemas com variáveis contínuas manipulando expressões definidas por casos que envolvem essas variáveis para obter a expressão da solução exata. No entanto, a manipulação envolve um aumento no número de casos usados na expressão, de forma que a representação exata das soluções pode se tornar intratavelmente custosa. Neste trabalho, pretendemos adaptar a PDS com uma técnica de aproximação que permite controlar o crescimento da complexidade das expressões em troca de um pequeno erro em seus valores. A maneira como pretendemos simplificar as expressões é baseada em reduzir o número de casos numa expressão simbólica, o que é feito unindo regiões de casos diferentes que apresentam valores próximos. Além disso, a eficiência da PDS pode ser melhorada modificando qual o cálculo usado para obter a expressão da solução. Uma forma de evitar cálculos desnecessários é utilizar a informação do estado inicial e fazer uma busca heurística a partir dele, restringindo a região de valores para os quais precisamos da solução ótima. Assim, pretendemos criar dois novos algoritmos que usam a manipulação simbólica das expressões com variáveis contínuas, adicionando componentes de técnicas recentes para planejamento probabilístico discreto.
publishDate 2015
dc.date.none.fl_str_mv 2015-05-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113351/
url https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113351/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090937600606208