Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas

Santos, Felipe Martins dos

Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas

Detalhes bibliográficos
Autor(a) principal:	Santos, Felipe Martins dos
Data de Publicação:	2013
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-12022014-140538/
Resumo:	Planejamento em inteligência artificial é a tarefa de determinar ações que satisfaçam um dado objetivo. Nos problemas de planejamento sob incerteza, as ações podem ter efeitos probabilísticos. Esses problemas são modelados como Processos de Decisão Markovianos (Markov Decision Processes - MDPs), modelos que permitem o cálculo de soluções ótimas considerando o valor esperado de cada ação em cada estado. Contudo, resolver problemas grandes de planejamento probabilístico, i.e., com um grande número de estados e ações, é um enorme desafio. MDPs grandes podem ser reduzidos através da computação de bissimulações estocásticas, i.e., relações de equivalência sobre o conjunto de estados do MDP original. A partir das bissimulações estocásticas, que podem ser exatas ou aproximadas, é possível obter um modelo abstrato reduzido que pode ser mais fácil de resolver do que o MDP original. No entanto, para problemas de alguns domínios, a computação da bissimulação estocástica sobre todo o espaço de estados é inviável. Os algoritmos propostos neste trabalho estendem os algoritmos usados para a computação de bissimulações estocásticas para MDPs de forma que elas sejam computadas sobre o conjunto de estados alcançáveis a partir de um dado estado inicial, que pode ser muito menor do que o conjunto de estados completo. Os resultados experimentais mostram que é possível resolver problemas grandes de planejamento probabilístico com desempenho superior às técnicas conhecidas de bissimulação estocástica.

Metadados do item

id	USP_fbd7e584bf5766c01f3b06d6dd2e0b65
oai_identifier_str	oai:teses.usp.br:tde-12022014-140538
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticasEfficient solutions to Markov decision processes based on reachability and stochastic bisimulationsAnálise de AlcançabilidadeBissimulação EstocásticaMarkov Decision ProcessesPlanejamento ProbabilísticoProbabilistic PlanningProcesso de Decisão MarkovianoReachability AnalysisStochastic BisimulationPlanejamento em inteligência artificial é a tarefa de determinar ações que satisfaçam um dado objetivo. Nos problemas de planejamento sob incerteza, as ações podem ter efeitos probabilísticos. Esses problemas são modelados como Processos de Decisão Markovianos (Markov Decision Processes - MDPs), modelos que permitem o cálculo de soluções ótimas considerando o valor esperado de cada ação em cada estado. Contudo, resolver problemas grandes de planejamento probabilístico, i.e., com um grande número de estados e ações, é um enorme desafio. MDPs grandes podem ser reduzidos através da computação de bissimulações estocásticas, i.e., relações de equivalência sobre o conjunto de estados do MDP original. A partir das bissimulações estocásticas, que podem ser exatas ou aproximadas, é possível obter um modelo abstrato reduzido que pode ser mais fácil de resolver do que o MDP original. No entanto, para problemas de alguns domínios, a computação da bissimulação estocástica sobre todo o espaço de estados é inviável. Os algoritmos propostos neste trabalho estendem os algoritmos usados para a computação de bissimulações estocásticas para MDPs de forma que elas sejam computadas sobre o conjunto de estados alcançáveis a partir de um dado estado inicial, que pode ser muito menor do que o conjunto de estados completo. Os resultados experimentais mostram que é possível resolver problemas grandes de planejamento probabilístico com desempenho superior às técnicas conhecidas de bissimulação estocástica.Planning in artificial intelligence is the task of finding actions to reach a given goal. In planning under uncertainty, the actions can have probabilistic effects. This problems are modeled using Markov Decision Processes (MDPs), models that enable the computation of optimal solutions considering the expected value of each action when applied in each state. However, to solve big probabilistic planning problems, i.e., those with a large number of states and actions, is still a challenge. Large MDPs can be reduced by computing stochastic bisimulations, i.e., equivalence relations over the original MDP states. From the stochastic bisimulations, that can be exact or approximated, it is possible to get an abstract reduced model that can be easier to solve than the original MDP. But, for some problems, the stochastic bisimulation computation over the whole state space is unfeasible. The algorithms proposed in this work extend the algorithms that are used to compute stochastic bisimulations for MDPs in a way that they can be computed over the reachable set of states with a given initial state, which can be much smaller than the complete set of states. The empirical results show that it is possible to solve large probabilistic planning problems with better performance than the known techniques of stochastic bisimulation.Biblioteca Digitais de Teses e Dissertações da USPBarros, Leliane Nunes deSantos, Felipe Martins dos2013-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/45/45134/tde-12022014-140538/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:11:46Zoai:teses.usp.br:tde-12022014-140538Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212016-07-28T16:11:46Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas Efficient solutions to Markov decision processes based on reachability and stochastic bisimulations
title	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
spellingShingle	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas Santos, Felipe Martins dos Análise de Alcançabilidade Bissimulação Estocástica Markov Decision Processes Planejamento Probabilístico Probabilistic Planning Processo de Decisão Markoviano Reachability Analysis Stochastic Bisimulation
title_short	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
title_full	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
title_fullStr	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
title_full_unstemmed	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
title_sort	Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas
author	Santos, Felipe Martins dos
author_facet	Santos, Felipe Martins dos
author_role	author
dc.contributor.none.fl_str_mv	Barros, Leliane Nunes de
dc.contributor.author.fl_str_mv	Santos, Felipe Martins dos
dc.subject.por.fl_str_mv	Análise de Alcançabilidade Bissimulação Estocástica Markov Decision Processes Planejamento Probabilístico Probabilistic Planning Processo de Decisão Markoviano Reachability Analysis Stochastic Bisimulation
topic	Análise de Alcançabilidade Bissimulação Estocástica Markov Decision Processes Planejamento Probabilístico Probabilistic Planning Processo de Decisão Markoviano Reachability Analysis Stochastic Bisimulation
description	Planejamento em inteligência artificial é a tarefa de determinar ações que satisfaçam um dado objetivo. Nos problemas de planejamento sob incerteza, as ações podem ter efeitos probabilísticos. Esses problemas são modelados como Processos de Decisão Markovianos (Markov Decision Processes - MDPs), modelos que permitem o cálculo de soluções ótimas considerando o valor esperado de cada ação em cada estado. Contudo, resolver problemas grandes de planejamento probabilístico, i.e., com um grande número de estados e ações, é um enorme desafio. MDPs grandes podem ser reduzidos através da computação de bissimulações estocásticas, i.e., relações de equivalência sobre o conjunto de estados do MDP original. A partir das bissimulações estocásticas, que podem ser exatas ou aproximadas, é possível obter um modelo abstrato reduzido que pode ser mais fácil de resolver do que o MDP original. No entanto, para problemas de alguns domínios, a computação da bissimulação estocástica sobre todo o espaço de estados é inviável. Os algoritmos propostos neste trabalho estendem os algoritmos usados para a computação de bissimulações estocásticas para MDPs de forma que elas sejam computadas sobre o conjunto de estados alcançáveis a partir de um dado estado inicial, que pode ser muito menor do que o conjunto de estados completo. Os resultados experimentais mostram que é possível resolver problemas grandes de planejamento probabilístico com desempenho superior às técnicas conhecidas de bissimulação estocástica.
publishDate	2013
dc.date.none.fl_str_mv	2013-12-09
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-12022014-140538/
url	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-12022014-140538/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1809090639925608448

Soluções eficientes para processos de decisão markovianos baseadas em alcançabilidade e bissimulações estocásticas

Registros relacionados