Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas

Luis Fernando Amorim França

Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas

Detalhes bibliográficos
Autor(a) principal:	Luis Fernando Amorim França
Data de Publicação:	2016
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações do INPE
Texto Completo:	http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36
Resumo:	As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit.

Metadados do item

id	INPE_02cca09da9ae51438a68149ac3d9b3c1
oai_identifier_str	oai:urlib.net:sid.inpe.br/mtc-m21b/2016/05.16.02.36.40-0
network_acronym_str	INPE
network_name_str	Biblioteca Digital de Teses e Dissertações do INPE
spelling	info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisAplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticasApplication of reinforcement learning for the spectrum allocation problem in elastic optical networks2016-05-16Solon Venâncio de CarvalhoRita de Cássia Meneses RodriguesHoracio Hideki YanasseCarlos Henrique Costa RibeiroArmando Zeferino MilioniLuis Fernando Amorim FrançaInstituto Nacional de Pesquisas Espaciais (INPE)Programa de Pós-Graduação do INPE em Computação AplicadaINPEBRredes ópticas elásticasalocação de espectroprocesso markoviano de decisãoaprendizagem por reforçoelastic optical networksspectrum allocationMarkov decision processreinforcement learningAs Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit.Elastic Optical Networks (EONs) have been recently proposed to provide flexibility over traditional optical networks. In these networks, resources, called slots, are allocated according to traffic demands, providing the possibility of generating optical paths to establish connection requests for different classes of services with heterogeneous bandwidth requirements. In order to establish the optical paths one must select which links will be used to route each connection and, for each link of the route, which slots will be allocated. In this work we focus in one link of an EON under dynamic traffic, and thus no routing needs to be done. We propose an analytical model, by means of a continuous-time Markov decision process, to find an optimal Spectrum Allocation (SA) policy. Once a SA policy is applied, we use a Markov chain to compute its performance metrics. For more realistic instances of the problem, however, the analytical model is computationally infeasible. Therefore, we also propose the use of a reinforcement learning algorithm in order to find SA policies for the cases where the analytical model cannot be applied. Numerical results are provided to illustrate the performance metrics of the SA policy derived from our model over two SA myopic policies commonly used in the literature, namely First-Fit and Best-Fit.http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações do INPEinstname:Instituto Nacional de Pesquisas Espaciais (INPE)instacron:INPE2021-07-31T06:55:05Zoai:urlib.net:sid.inpe.br/mtc-m21b/2016/05.16.02.36.40-0Biblioteca Digital de Teses e Dissertaçõeshttp://bibdigital.sid.inpe.br/PUBhttp://bibdigital.sid.inpe.br/col/iconet.com.br/banon/2003/11.21.21.08/doc/oai.cgiopendoar:32772021-07-31 06:55:06.379Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE)false
dc.title.pt.fl_str_mv	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
dc.title.alternative.en.fl_str_mv	Application of reinforcement learning for the spectrum allocation problem in elastic optical networks
title	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
spellingShingle	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas Luis Fernando Amorim França
title_short	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
title_full	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
title_fullStr	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
title_full_unstemmed	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
title_sort	Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas
author	Luis Fernando Amorim França
author_facet	Luis Fernando Amorim França
author_role	author
dc.contributor.advisor1.fl_str_mv	Solon Venâncio de Carvalho
dc.contributor.advisor2.fl_str_mv	Rita de Cássia Meneses Rodrigues
dc.contributor.referee1.fl_str_mv	Horacio Hideki Yanasse
dc.contributor.referee2.fl_str_mv	Carlos Henrique Costa Ribeiro
dc.contributor.referee3.fl_str_mv	Armando Zeferino Milioni
dc.contributor.author.fl_str_mv	Luis Fernando Amorim França
contributor_str_mv	Solon Venâncio de Carvalho Rita de Cássia Meneses Rodrigues Horacio Hideki Yanasse Carlos Henrique Costa Ribeiro Armando Zeferino Milioni
dc.description.abstract.por.fl_txt_mv	As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit.
dc.description.abstract.eng.fl_txt_mv	Elastic Optical Networks (EONs) have been recently proposed to provide flexibility over traditional optical networks. In these networks, resources, called slots, are allocated according to traffic demands, providing the possibility of generating optical paths to establish connection requests for different classes of services with heterogeneous bandwidth requirements. In order to establish the optical paths one must select which links will be used to route each connection and, for each link of the route, which slots will be allocated. In this work we focus in one link of an EON under dynamic traffic, and thus no routing needs to be done. We propose an analytical model, by means of a continuous-time Markov decision process, to find an optimal Spectrum Allocation (SA) policy. Once a SA policy is applied, we use a Markov chain to compute its performance metrics. For more realistic instances of the problem, however, the analytical model is computationally infeasible. Therefore, we also propose the use of a reinforcement learning algorithm in order to find SA policies for the cases where the analytical model cannot be applied. Numerical results are provided to illustrate the performance metrics of the SA policy derived from our model over two SA myopic policies commonly used in the literature, namely First-Fit and Best-Fit.
description	As Redes ópticas elásticas vêm sendo desenvolvidas recentemente com o intuito de prover maior flexibilidade em relação às redes ópticas tradicionais. Nessas redes, recursos, denominados slots, são alocados de acordo com a demanda de tráfego. Torna-se possível, então, a geração de caminhos ópticos para estabelecer conexões para diferentes classes de serviços com requerimentos de banda heterogêneos. Ao se estabelecer um caminho óptico deve-se selecionar quais enlaces serão utilizados para rotear a conexão e, para cada enlace dessa rota, quais slots serão alocados. Neste trabalho focamos em um enlace de uma rede óptica elástica sob tráfego dinâmico, e, portanto, o roteamento não precisa ser realizado. Nós propomos um modelo analítico, por meio de um processo markoviano de decisão a tempo contínuo, para encontrar uma política ótima de alocação de espectro. Uma vez que essa política é aplicada, nós utilizamos uma cadeia de Markov para calcular suas medidas de desempenho. Para instâncias mais realistas do problema, no entanto, o modelo analítico torna-se inviável de ser resolvido, seja por restrições de memória ou tempo de processamento. Dessa forma, propomos também a utilização de um algoritmo de aprendizagem por reforço para encontrar políticas de alocação de espectro nos casos em que o modelo analítico não pode ser aplicado. Resultados numéricos são apresentados para ilustrar as medidas de desempenho da política de alocação de espectro derivada do nosso modelo em relação a duas políticas comumente utilizadas na literatura, First-Fit e Best-Fit.
publishDate	2016
dc.date.issued.fl_str_mv	2016-05-16
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
status_str	publishedVersion
format	doctoralThesis
dc.identifier.uri.fl_str_mv	http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36
url	http://urlib.net/sid.inpe.br/mtc-m21b/2016/05.16.02.36
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Instituto Nacional de Pesquisas Espaciais (INPE)
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação do INPE em Computação Aplicada
dc.publisher.initials.fl_str_mv	INPE
dc.publisher.country.fl_str_mv	BR
publisher.none.fl_str_mv	Instituto Nacional de Pesquisas Espaciais (INPE)
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações do INPE instname:Instituto Nacional de Pesquisas Espaciais (INPE) instacron:INPE
reponame_str	Biblioteca Digital de Teses e Dissertações do INPE
collection	Biblioteca Digital de Teses e Dissertações do INPE
instname_str	Instituto Nacional de Pesquisas Espaciais (INPE)
instacron_str	INPE
institution	INPE
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE)
repository.mail.fl_str_mv
publisher_program_txtF_mv	Programa de Pós-Graduação do INPE em Computação Aplicada
contributor_advisor1_txtF_mv	Solon Venâncio de Carvalho
_version_	1706809358544797696

Aplicação da aprendizagem por reforço para o problema de alocação de espectro em redes ópticas elásticas

Registros relacionados