Método de diferenças temporais aplicado às equações de Riccati acopladas entre si
Autor(a) principal: | |
---|---|
Data de Publicação: | 2003 |
Outros Autores: | |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Sba: Controle & Automação Sociedade Brasileira de Automatica |
Texto Completo: | http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001 |
Resumo: | Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA. |
id |
SBA-2_3fbd8e55d96fcf5e90b6fdc6cd58ccc5 |
---|---|
oai_identifier_str |
oai:scielo:S0103-17592003000300001 |
network_acronym_str |
SBA-2 |
network_name_str |
Sba: Controle & Automação Sociedade Brasileira de Automatica |
repository_id_str |
|
spelling |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre siSimulações de monte carloequações algébricas de Riccati acopladas entre sisistemas com saltoscontrole ótimoNeste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA.Sociedade Brasileira de Automática2003-09-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersiontext/htmlhttp://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001Sba: Controle & Automação Sociedade Brasileira de Automatica v.14 n.3 2003reponame:Sba: Controle & Automação Sociedade Brasileira de Automaticainstname:Sociedade Brasileira de Automática (SBA)instacron:SBA10.1590/S0103-17592003000300001info:eu-repo/semantics/openAccessCosta,Oswaldo L. V.Aya,Julio C.C.por2003-11-19T00:00:00Zoai:scielo:S0103-17592003000300001Revistahttps://www.sba.org.br/revista/PUBhttps://old.scielo.br/oai/scielo-oai.php||revista_sba@fee.unicamp.br1807-03450103-1759opendoar:2003-11-19T00:00Sba: Controle & Automação Sociedade Brasileira de Automatica - Sociedade Brasileira de Automática (SBA)false |
dc.title.none.fl_str_mv |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
title |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
spellingShingle |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si Costa,Oswaldo L. V. Simulações de monte carlo equações algébricas de Riccati acopladas entre si sistemas com saltos controle ótimo |
title_short |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
title_full |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
title_fullStr |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
title_full_unstemmed |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
title_sort |
Método de diferenças temporais aplicado às equações de Riccati acopladas entre si |
author |
Costa,Oswaldo L. V. |
author_facet |
Costa,Oswaldo L. V. Aya,Julio C.C. |
author_role |
author |
author2 |
Aya,Julio C.C. |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Costa,Oswaldo L. V. Aya,Julio C.C. |
dc.subject.por.fl_str_mv |
Simulações de monte carlo equações algébricas de Riccati acopladas entre si sistemas com saltos controle ótimo |
topic |
Simulações de monte carlo equações algébricas de Riccati acopladas entre si sistemas com saltos controle ótimo |
description |
Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA. |
publishDate |
2003 |
dc.date.none.fl_str_mv |
2003-09-01 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001 |
url |
http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592003000300001 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
10.1590/S0103-17592003000300001 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
text/html |
dc.publisher.none.fl_str_mv |
Sociedade Brasileira de Automática |
publisher.none.fl_str_mv |
Sociedade Brasileira de Automática |
dc.source.none.fl_str_mv |
Sba: Controle & Automação Sociedade Brasileira de Automatica v.14 n.3 2003 reponame:Sba: Controle & Automação Sociedade Brasileira de Automatica instname:Sociedade Brasileira de Automática (SBA) instacron:SBA |
instname_str |
Sociedade Brasileira de Automática (SBA) |
instacron_str |
SBA |
institution |
SBA |
reponame_str |
Sba: Controle & Automação Sociedade Brasileira de Automatica |
collection |
Sba: Controle & Automação Sociedade Brasileira de Automatica |
repository.name.fl_str_mv |
Sba: Controle & Automação Sociedade Brasileira de Automatica - Sociedade Brasileira de Automática (SBA) |
repository.mail.fl_str_mv |
||revista_sba@fee.unicamp.br |
_version_ |
1754824563960578048 |