Processo de decisão de Markov limitados por linguagem

Pellegrini, Jerônimo

Processo de decisão de Markov limitados por linguagem

Detalhes bibliográficos
Autor(a) principal:	Pellegrini, Jerônimo
Data de Publicação:	2006
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo:	https://hdl.handle.net/20.500.12733/1604497
Resumo:	Orientador: Jacques Wainer

Metadados do item

id	UNICAMP-30_b5eeaa133c1b2826df5bfed73bbd02ea
oai_identifier_str	oai::396767
network_acronym_str	UNICAMP-30
network_name_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling	Processo de decisão de Markov limitados por linguagemLanguage limited Markov decision processesInteligência artificialProbabilidadesTeoria da decisãoProcessos de MarkovArtificial intelligenceProbabilityDecision theoryMarkoff processesOrientador: Jacques WainerTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Processos de decisão de Markov (MDPs) são usados para modelar situações onde é necessário executar ações em sequência em ambientes com incerteza. Este trabalho define uma nova formulação dos processos de decisão de Markov, adicionando a estes a possibilidade de restringir as ações e observações a serem consideradas a cada época de decisão. Estas restrições são descritas na forma de um autômato finito ? assim, a sequência de possíveis ações e observações consideradas na busca pela política ótima passa a ser uma linguagem regular. Chamamos estes processos de Markov limitados por linguagem (LLMDPs e LL-POMDPs). O uso de autômatos para a especificação de restrições facilita o processo de modelagem de problemas. Apresentamos diferentes abordagens para a solução destes problemas, e comparamos seus desempenhos, mostrando que a solução é viável, e mostramos também que em algumas situações o uso de restrições pode ser usado para acelerar a busca por uma solução. Além disso, apresentamos uma modificação nos LLPOMDPs de forma que seja possível especificar duração probabilística discreta para as ações e observaçõesAbstract: Markov decision processes (MDPs) are used to model situations where one needs to execute sequences of actions under uncertainty. This work defines a new formulation of Markov decision processes, with the possibility of restricting the actions and observations to be considered at each decision epoch. These restrictions are described as a finite automation, so the sequence of possible actions (and observations) considered during the search for an optimal policy is a regular language. We call these ?language limited Markov decision processes (LL-MDPs and LL-POMDPs). The use of automata for specifying restrictions helps make the modeling process easier. We present different approaches to solve these problems, and compare their performance, showing that the solution is feasible, and we also show that in some situations some restrictions can be used to speed up the search for a solution. Besides that, we also present one modification on LL-POMDPs to make it possible to specify probabilistic discrete duration for actions and observationsDoutoradoSistemas de InformaçãoDoutor em Ciência da Computação[s.n.]Wainer, Jacques, 1958-Barros, Leliane Nunes deRibeiro, Carlos Henrique CostaGoldenstein, Siome KleinMoura, Arnaldo VieiraUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASPellegrini, Jerônimo20062006-07-31T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf136p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1604497PELLEGRINI, Jerônimo. Processo de decisão de Markov limitados por linguagem. 2006. 136p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1604497. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/396767porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T04:48:28Zoai::396767Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T04:48:28Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv	Processo de decisão de Markov limitados por linguagem Language limited Markov decision processes
title	Processo de decisão de Markov limitados por linguagem
spellingShingle	Processo de decisão de Markov limitados por linguagem Pellegrini, Jerônimo Inteligência artificial Probabilidades Teoria da decisão Processos de Markov Artificial intelligence Probability Decision theory Markoff processes
title_short	Processo de decisão de Markov limitados por linguagem
title_full	Processo de decisão de Markov limitados por linguagem
title_fullStr	Processo de decisão de Markov limitados por linguagem
title_full_unstemmed	Processo de decisão de Markov limitados por linguagem
title_sort	Processo de decisão de Markov limitados por linguagem
author	Pellegrini, Jerônimo
author_facet	Pellegrini, Jerônimo
author_role	author
dc.contributor.none.fl_str_mv	Wainer, Jacques, 1958- Barros, Leliane Nunes de Ribeiro, Carlos Henrique Costa Goldenstein, Siome Klein Moura, Arnaldo Vieira Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv	Pellegrini, Jerônimo
dc.subject.por.fl_str_mv	Inteligência artificial Probabilidades Teoria da decisão Processos de Markov Artificial intelligence Probability Decision theory Markoff processes
topic	Inteligência artificial Probabilidades Teoria da decisão Processos de Markov Artificial intelligence Probability Decision theory Markoff processes
description	Orientador: Jacques Wainer
publishDate	2006
dc.date.none.fl_str_mv	2006 2006-07-31T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	(Broch.) https://hdl.handle.net/20.500.12733/1604497 PELLEGRINI, Jerônimo. Processo de decisão de Markov limitados por linguagem. 2006. 136p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1604497. Acesso em: 2 set. 2024.
identifier_str_mv	(Broch.) PELLEGRINI, Jerônimo. Processo de decisão de Markov limitados por linguagem. 2006. 136p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1604497. Acesso em: 2 set. 2024.
url	https://hdl.handle.net/20.500.12733/1604497
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://repositorio.unicamp.br/acervo/detalhe/396767
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf 136p. : il.
dc.publisher.none.fl_str_mv	[s.n.]
publisher.none.fl_str_mv	[s.n.]
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP
instname_str	Universidade Estadual de Campinas (UNICAMP)
instacron_str	UNICAMP
institution	UNICAMP
reponame_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv	sbubd@unicamp.br
_version_	1809188960961822720

Processo de decisão de Markov limitados por linguagem

Registros relacionados