Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do INPE |
Texto Completo: | http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36 |
Resumo: | As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit. |
id |
INPE_02cca09da9ae51438a68149ac3d9b3c1 |
---|---|
oai_identifier_str |
oai:urlib.net:sid.inpe.br/mtc-m21b/2016/05.16.02.36.40-0 |
network_acronym_str |
INPE |
network_name_str |
Biblioteca Digital de Teses e Dissertações do INPE |
spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisAplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticasApplication of reinforcement learning for the spectrum allocation problem in elastic optical networks2016-05-16Solon Venâncio de CarvalhoRita de Cássia Meneses RodriguesHoracio Hideki YanasseCarlos Henrique Costa RibeiroArmando Zeferino MilioniLuis Fernando Amorim FrançaInstituto Nacional de Pesquisas Espaciais (INPE)Programa de Pós-Graduação do INPE em Computação AplicadaINPEBRredes ópticas elásticasalocação de espectroprocesso markoviano de decisãoaprendizagem por reforçoelastic optical networksspectrum allocationMarkov decision processreinforcement learningAs Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit.Elastic Optical Networks (EONs) have been recently proposed to provide flexibility over traditional optical networks. In these networks, resources, called slots, are allocated according to traffic demands, providing the possibility of generating optical paths to establish connection requests for different classes of services with heterogeneous bandwidth requirements. In order to establish the optical paths one must select which links will be used to route each connection and, for each link of the route, which slots will be allocated. In this work we focus in one link of an EON under dynamic traffic, and thus no routing needs to be done. We propose an analytical model, by means of a continuous-time Markov decision process, to find an optimal Spectrum Allocation (SA) policy. Once a SA policy is applied, we use a Markov chain to compute its performance metrics. For more realistic instances of the problem, however, the analytical model is computationally infeasible. Therefore, we also propose the use of a reinforcement learning algorithm in order to find SA policies for the cases where the analytical model cannot be applied. Numerical results are provided to illustrate the performance metrics of the SA policy derived from our model over two SA myopic policies commonly used in the literature, namely First-Fit and Best-Fit.http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações do INPEinstname:Instituto Nacional de Pesquisas Espaciais (INPE)instacron:INPE2021-07-31T06:55:05Zoai:urlib.net:sid.inpe.br/mtc-m21b/2016/05.16.02.36.40-0Biblioteca Digital de Teses e Dissertaçõeshttp://bibdigital.sid.inpe.br/PUBhttp://bibdigital.sid.inpe.br/col/iconet.com.br/banon/2003/11.21.21.08/doc/oai.cgiopendoar:32772021-07-31 06:55:06.379Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE)false |
dc.title.pt.fl_str_mv |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
dc.title.alternative.en.fl_str_mv |
Application of reinforcement learning for the spectrum allocation problem in elastic optical networks |
title |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
spellingShingle |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas Luis Fernando Amorim França |
title_short |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
title_full |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
title_fullStr |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
title_full_unstemmed |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
title_sort |
Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas |
author |
Luis Fernando Amorim França |
author_facet |
Luis Fernando Amorim França |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Solon Venâncio de Carvalho |
dc.contributor.advisor2.fl_str_mv |
Rita de Cássia Meneses Rodrigues |
dc.contributor.referee1.fl_str_mv |
Horacio Hideki Yanasse |
dc.contributor.referee2.fl_str_mv |
Carlos Henrique Costa Ribeiro |
dc.contributor.referee3.fl_str_mv |
Armando Zeferino Milioni |
dc.contributor.author.fl_str_mv |
Luis Fernando Amorim França |
contributor_str_mv |
Solon Venâncio de Carvalho Rita de Cássia Meneses Rodrigues Horacio Hideki Yanasse Carlos Henrique Costa Ribeiro Armando Zeferino Milioni |
dc.description.abstract.por.fl_txt_mv |
As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit. |
dc.description.abstract.eng.fl_txt_mv |
Elastic Optical Networks (EONs) have been recently proposed to provide flexibility over traditional optical networks. In these networks, resources, called slots, are allocated according to traffic demands, providing the possibility of generating optical paths to establish connection requests for different classes of services with heterogeneous bandwidth requirements. In order to establish the optical paths one must select which links will be used to route each connection and, for each link of the route, which slots will be allocated. In this work we focus in one link of an EON under dynamic traffic, and thus no routing needs to be done. We propose an analytical model, by means of a continuous-time Markov decision process, to find an optimal Spectrum Allocation (SA) policy. Once a SA policy is applied, we use a Markov chain to compute its performance metrics. For more realistic instances of the problem, however, the analytical model is computationally infeasible. Therefore, we also propose the use of a reinforcement learning algorithm in order to find SA policies for the cases where the analytical model cannot be applied. Numerical results are provided to illustrate the performance metrics of the SA policy derived from our model over two SA myopic policies commonly used in the literature, namely First-Fit and Best-Fit. |
description |
As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-05-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
status_str |
publishedVersion |
format |
doctoralThesis |
dc.identifier.uri.fl_str_mv |
http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36 |
url |
http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Instituto Nacional de Pesquisas Espaciais (INPE) |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação do INPE em Computação Aplicada |
dc.publisher.initials.fl_str_mv |
INPE |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Instituto Nacional de Pesquisas Espaciais (INPE) |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do INPE instname:Instituto Nacional de Pesquisas Espaciais (INPE) instacron:INPE |
reponame_str |
Biblioteca Digital de Teses e Dissertações do INPE |
collection |
Biblioteca Digital de Teses e Dissertações do INPE |
instname_str |
Instituto Nacional de Pesquisas Espaciais (INPE) |
instacron_str |
INPE |
institution |
INPE |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE) |
repository.mail.fl_str_mv |
|
publisher_program_txtF_mv |
Programa de Pós-Graduação do INPE em Computação Aplicada |
contributor_advisor1_txtF_mv |
Solon Venâncio de Carvalho |
_version_ |
1706809358544797696 |