Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.

Detalhes bibliográficos
Autor(a) principal: SILVA, Giovanni Farias da.
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702
Resumo: O modelo de Computação na Nuvem de infraestrutura como serviço (IaaS,do inglês Infraestructureas a Service) tem se tornado cada vez mais a principal escolha de provisionamento de infraestrutura de computação. Com isso, cresce também a diversidade das cargas de trabalho submetidas pelos usuários. Essa característica, juntamente com a heterogeneidade das complexas infraestruturas usadas para executar essas cargas de trabalho, tornando gerenciamento de recursos um dos principais desafios para provedores de computação na nuvem de larga escala. Para aumentar a utilização de recursos (consequentemente a lucratividade) e satisfazer as necessidades distintas dos usuários, os provedores podem oferecer múltiplas classes de serviço. Essas classes são diferenciadas pela qualidade de serviço (QoS,do inglês Quality of Service) prometida, que comumente é definida em termos de objetivos de nível de serviço (SLO,do inglês Service Level Objectives) estabelecidos em um contrato de nível de serviço (SLA, do inglês Service Level Agreement). Por outro lado, os provedores estão sujeitos ao pagamento de penalidades em caso de violações dos SLAs. O gerenciamento de recursos é dividido em etapas com responsabilidades bem definidas. Essas etapas operam em conjunto com o intuito de evitar cenários de superprovisionamento (mantendo os custos o mais baixo possível) e subprovisionamento (mantendo a QoSem níveis aceitáveis). A atividade de escalonamento é responsável por definir quais requisições devem ter recursos alocados em um dado instante e quais os servidores devem prover esses recursos. No contexto de provedores de larga escala, políticas de escalonamento base a das em prioridades geralmente são utilizadas para garantir que as requisições de diferentes classes de serviço receba maQoS prometida. Prioridades maiores são associadas com classes cujas QoSs prometidas são maiores. Caso seja necessário, recursos alocados para requisições com prioridades menores podem ser preemptados para permitir que requisições com prioridades maiores sejam executadas. Porém, nesse contexto, a QoS entregue às requisições durante períodos com contenção de recursos pode ser injusta para certas requisições. Em particular, requisições com prioridades mais baixas podem ter seus recursos preemptados para a como dar outras com prioridades mais altas, mesmo se a QoS entregue para as últimas esteja acima da desejada, e a QoS das primeiras esteja abaixo da esperada. Além disso, requisições com mesma prioridade e que competem pelo mesmo recurso podem experimentar QoSs bem diferentes, visto que algumas delas podem sempre executar enquanto outras permanecem sempre pendentes. Este trabalho apresenta uma política de escalonamento que é orientada pela QoS prometida para as requisições. Esta segue uma nova abordagem de preempção na qual qualquer requisição cuja QoS atual esteja excedendo sua respectiva meta pode ter seus recursos preemptados em benefício de outras com QoS abaixo da meta (ou que estejam mais próximas de ter seus SLOs não satisfeitos). Os benefícios de usar uma política orientada por QoS são :(i) ela mantém a QoS de cada requisição a mais alta possível, considerando suas respectivas metas e recursos disponíveis; e (ii) ela minimiza a variância da QoS entregue para requisições de uma mesma classe, promovendo o provisionamento justo. Essas características permitem a definição de SLAs que são mais apropriados e que estão de acordo com os principais provedores de nuvem pública. A política proposta foi avaliada através de comparações entre seus resultados e os obtidos com um escalonador que representa o estado-da-prática, baseado em prioridade. Esta comparação se deu por experimentos de simulação—validados por experimentos de medição alimentados por amostras de rastros de execução de um sistema em produção. No geral, o escalonamento orientado por QoS entrega um serviço melhor que o baseado em prioridade, especialmente quando a contenção de recursos não é tão alta. A similaridade da QoS entregue para requisições de uma mesma classe também foi muito mais alta quando o escalonamento orientado por QoS foi utilizado, particularmente quando nem todas as requisições receberam a QoS prometida. Além disso, com base na prática atual de grandes provedores públicos, os resultados mostraram que as penalidades incorridas pelo uso do escalonador baseado em prioridade podem ser, em média, até aproximadamente 2 vezes mais altas que aquelas incorridas pelo escalonador orientado por QoS. Por fim, o custo operacional do escalonador orientado por QoS foi aproximadamente 15 vezes maior. Porém, ainda há espaço para a implementação de otimizações, tal como um mecanismo de cache já implementado no escalonamento base a do em prioridade. A nova política ainda se mostrou viável de ser implementada em um sistema real. As métricas utilizadas por seu escalonador foram definidas de forma que a política opere no sistema sem interferir na forma como os usuários interagem como mesmo.
id UFCG_0c9646710d88f2ea544bad4714b9b8e2
oai_identifier_str oai:localhost:riufcg/12702
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.Scaling driven by quality of service in cloud computing infrastructures.Computação na nuvemCloud ComputingComputación en la nubeEscalonamentoProgramaciónSchedulingQualidade de serviçoService qualityCalidad de servicioProvisionamento justoAprovisionamiento justoFair provisioningCiência da ComputaçãoMetodologia e Técnicas da ComputaçãoO modelo de Computação na Nuvem de infraestrutura como serviço (IaaS,do inglês Infraestructureas a Service) tem se tornado cada vez mais a principal escolha de provisionamento de infraestrutura de computação. Com isso, cresce também a diversidade das cargas de trabalho submetidas pelos usuários. Essa característica, juntamente com a heterogeneidade das complexas infraestruturas usadas para executar essas cargas de trabalho, tornando gerenciamento de recursos um dos principais desafios para provedores de computação na nuvem de larga escala. Para aumentar a utilização de recursos (consequentemente a lucratividade) e satisfazer as necessidades distintas dos usuários, os provedores podem oferecer múltiplas classes de serviço. Essas classes são diferenciadas pela qualidade de serviço (QoS,do inglês Quality of Service) prometida, que comumente é definida em termos de objetivos de nível de serviço (SLO,do inglês Service Level Objectives) estabelecidos em um contrato de nível de serviço (SLA, do inglês Service Level Agreement). Por outro lado, os provedores estão sujeitos ao pagamento de penalidades em caso de violações dos SLAs. O gerenciamento de recursos é dividido em etapas com responsabilidades bem definidas. Essas etapas operam em conjunto com o intuito de evitar cenários de superprovisionamento (mantendo os custos o mais baixo possível) e subprovisionamento (mantendo a QoSem níveis aceitáveis). A atividade de escalonamento é responsável por definir quais requisições devem ter recursos alocados em um dado instante e quais os servidores devem prover esses recursos. No contexto de provedores de larga escala, políticas de escalonamento base a das em prioridades geralmente são utilizadas para garantir que as requisições de diferentes classes de serviço receba maQoS prometida. Prioridades maiores são associadas com classes cujas QoSs prometidas são maiores. Caso seja necessário, recursos alocados para requisições com prioridades menores podem ser preemptados para permitir que requisições com prioridades maiores sejam executadas. Porém, nesse contexto, a QoS entregue às requisições durante períodos com contenção de recursos pode ser injusta para certas requisições. Em particular, requisições com prioridades mais baixas podem ter seus recursos preemptados para a como dar outras com prioridades mais altas, mesmo se a QoS entregue para as últimas esteja acima da desejada, e a QoS das primeiras esteja abaixo da esperada. Além disso, requisições com mesma prioridade e que competem pelo mesmo recurso podem experimentar QoSs bem diferentes, visto que algumas delas podem sempre executar enquanto outras permanecem sempre pendentes. Este trabalho apresenta uma política de escalonamento que é orientada pela QoS prometida para as requisições. Esta segue uma nova abordagem de preempção na qual qualquer requisição cuja QoS atual esteja excedendo sua respectiva meta pode ter seus recursos preemptados em benefício de outras com QoS abaixo da meta (ou que estejam mais próximas de ter seus SLOs não satisfeitos). Os benefícios de usar uma política orientada por QoS são :(i) ela mantém a QoS de cada requisição a mais alta possível, considerando suas respectivas metas e recursos disponíveis; e (ii) ela minimiza a variância da QoS entregue para requisições de uma mesma classe, promovendo o provisionamento justo. Essas características permitem a definição de SLAs que são mais apropriados e que estão de acordo com os principais provedores de nuvem pública. A política proposta foi avaliada através de comparações entre seus resultados e os obtidos com um escalonador que representa o estado-da-prática, baseado em prioridade. Esta comparação se deu por experimentos de simulação—validados por experimentos de medição alimentados por amostras de rastros de execução de um sistema em produção. No geral, o escalonamento orientado por QoS entrega um serviço melhor que o baseado em prioridade, especialmente quando a contenção de recursos não é tão alta. A similaridade da QoS entregue para requisições de uma mesma classe também foi muito mais alta quando o escalonamento orientado por QoS foi utilizado, particularmente quando nem todas as requisições receberam a QoS prometida. Além disso, com base na prática atual de grandes provedores públicos, os resultados mostraram que as penalidades incorridas pelo uso do escalonador baseado em prioridade podem ser, em média, até aproximadamente 2 vezes mais altas que aquelas incorridas pelo escalonador orientado por QoS. Por fim, o custo operacional do escalonador orientado por QoS foi aproximadamente 15 vezes maior. Porém, ainda há espaço para a implementação de otimizações, tal como um mecanismo de cache já implementado no escalonamento base a do em prioridade. A nova política ainda se mostrou viável de ser implementada em um sistema real. As métricas utilizadas por seu escalonador foram definidas de forma que a política opere no sistema sem interferir na forma como os usuários interagem como mesmo.The Cloud Computing model of infrastructure as a service (IaaS, from Infraestructureas a Service) has increasingly become the main choice for provisioning computing infrastructure. As a result, the diversity of workloads submitted by users also grows. This feature, coupled with the heterogeneity of the complex infrastructures used to run these workloads, make resource management one of the main challenges for large-scale cloud computing providers. To increase the use of resources (consequently profitability) and satisfy the different needs of users, providers can offer multiple classes of service. These classes are distinguished by the promised quality of service (QoS), which is commonly defined in terms of service level objectives (SLO) established in a service level agreement (SLA , from the English Service Level Agreement). On the other hand, providers are subject to the payment of penalties in case of breaches of the SLAs. Resource management is divided into stages with well-defined responsibilities. These steps operate together in order to avoid over-provisioning scenarios (keeping costs as low as possible) and under-provisioning (keeping QoS at acceptable levels). The scheduling activity is responsible for defining which requests must have resources allocated at a given time and which servers must provide these resources. In the context of large-scale providers, priority-based scheduling policies are generally used to ensure that requests for different classes of service receive promised maQoS. Higher priorities are associated with classes whose promised QoSs are higher. If necessary, resources allocated to requests with lower priorities can be preempted to allow requests with higher priorities to be executed. However, in this context, the QoS delivered to requests during periods of resource contention may be unfair for certain requests. In particular, requests with lower priorities may have their resources preempted for how to give others with higher priorities, even if the QoS delivered to the latter is above the desired level, and the QoS of the former is below expected. In addition, requests with the same priority and competing for the same resource can experience very different QoSs, since some of them can always be executed while others remain always pending. This work presents a scheduling policy that is guided by the QoS promised for the requests. This follows a new preemption approach in which any request whose current QoS is exceeding its respective target may have its resources preempted for the benefit of others with QoS below the target (or that are closer to having their SLOs not satisfied). The benefits of using a QoS-oriented policy are: (i) it keeps the QoS for each request as high as possible, considering their respective goals and available resources; and (ii) it minimizes the variance of the QoS delivered for requests of the same class, promoting fair provisioning. These characteristics allow the definition of SLAs that are more appropriate and that are in agreement with the main public cloud providers. The proposed policy was evaluated through comparisons between its results and those obtained with a scheduler that represents the state of practice, based on priority. This comparison was made by simulation experiments — validated by measurement experiments fed by samples of the execution tracks of a production system. Overall, QoS-driven scheduling delivers better service than priority-based, especially when resource contention is not as high. The similarity of QoS delivered for requests from the same class was also much higher when QoS-oriented scheduling was used, particularly when not all requests received the promised QoS. In addition, based on the current practice of large public providers, the results showed that the penalties incurred for using the priority-based scheduler can be, on average, up to approximately 2 times higher than those incurred by the QoS-driven scheduler. , the operating cost of the QoS-oriented scheduler was approximately 15 times higher. However, there is still room for the implementation of optimizations, such as a cache mechanism already implemented in the base-a-priority scheduling. The new policy still proved viable to be implemented in a real system. The metrics used by your scheduler have been defined so that the policy operates on the system without interfering with the way users interact as they do.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBRASILEIRO, Francisco Vilar.LOPES, Raquel Vigolvino.LOPES, R. V.http://lattes.cnpq.br/0577503698179302BRITO, Andrey Elísio Monteiro.GOMES, Reinaldo César de Morais.ZORZO, Avelino Francisco.SENGER, Hermes.SILVA, Giovanni Farias da.2020-02-182020-04-07T16:03:54Z2020-04-072020-04-07T16:03:54Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702SILVA, G. F. da. Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem. 2020. 145 f. Tese (Doutorado em Sistemas e Computação), Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2020. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-17T11:13:11Zoai:localhost:riufcg/12702Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-17T11:13:11Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
Scaling driven by quality of service in cloud computing infrastructures.
title Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
spellingShingle Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
SILVA, Giovanni Farias da.
Computação na nuvem
Cloud Computing
Computación en la nube
Escalonamento
Programación
Scheduling
Qualidade de serviço
Service quality
Calidad de servicio
Provisionamento justo
Aprovisionamiento justo
Fair provisioning
Ciência da Computação
Metodologia e Técnicas da Computação
title_short Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
title_full Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
title_fullStr Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
title_full_unstemmed Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
title_sort Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem.
author SILVA, Giovanni Farias da.
author_facet SILVA, Giovanni Farias da.
author_role author
dc.contributor.none.fl_str_mv BRASILEIRO, Francisco Vilar.
LOPES, Raquel Vigolvino.
LOPES, R. V.
http://lattes.cnpq.br/0577503698179302
BRITO, Andrey Elísio Monteiro.
GOMES, Reinaldo César de Morais.
ZORZO, Avelino Francisco.
SENGER, Hermes.
dc.contributor.author.fl_str_mv SILVA, Giovanni Farias da.
dc.subject.por.fl_str_mv Computação na nuvem
Cloud Computing
Computación en la nube
Escalonamento
Programación
Scheduling
Qualidade de serviço
Service quality
Calidad de servicio
Provisionamento justo
Aprovisionamiento justo
Fair provisioning
Ciência da Computação
Metodologia e Técnicas da Computação
topic Computação na nuvem
Cloud Computing
Computación en la nube
Escalonamento
Programación
Scheduling
Qualidade de serviço
Service quality
Calidad de servicio
Provisionamento justo
Aprovisionamiento justo
Fair provisioning
Ciência da Computação
Metodologia e Técnicas da Computação
description O modelo de Computação na Nuvem de infraestrutura como serviço (IaaS,do inglês Infraestructureas a Service) tem se tornado cada vez mais a principal escolha de provisionamento de infraestrutura de computação. Com isso, cresce também a diversidade das cargas de trabalho submetidas pelos usuários. Essa característica, juntamente com a heterogeneidade das complexas infraestruturas usadas para executar essas cargas de trabalho, tornando gerenciamento de recursos um dos principais desafios para provedores de computação na nuvem de larga escala. Para aumentar a utilização de recursos (consequentemente a lucratividade) e satisfazer as necessidades distintas dos usuários, os provedores podem oferecer múltiplas classes de serviço. Essas classes são diferenciadas pela qualidade de serviço (QoS,do inglês Quality of Service) prometida, que comumente é definida em termos de objetivos de nível de serviço (SLO,do inglês Service Level Objectives) estabelecidos em um contrato de nível de serviço (SLA, do inglês Service Level Agreement). Por outro lado, os provedores estão sujeitos ao pagamento de penalidades em caso de violações dos SLAs. O gerenciamento de recursos é dividido em etapas com responsabilidades bem definidas. Essas etapas operam em conjunto com o intuito de evitar cenários de superprovisionamento (mantendo os custos o mais baixo possível) e subprovisionamento (mantendo a QoSem níveis aceitáveis). A atividade de escalonamento é responsável por definir quais requisições devem ter recursos alocados em um dado instante e quais os servidores devem prover esses recursos. No contexto de provedores de larga escala, políticas de escalonamento base a das em prioridades geralmente são utilizadas para garantir que as requisições de diferentes classes de serviço receba maQoS prometida. Prioridades maiores são associadas com classes cujas QoSs prometidas são maiores. Caso seja necessário, recursos alocados para requisições com prioridades menores podem ser preemptados para permitir que requisições com prioridades maiores sejam executadas. Porém, nesse contexto, a QoS entregue às requisições durante períodos com contenção de recursos pode ser injusta para certas requisições. Em particular, requisições com prioridades mais baixas podem ter seus recursos preemptados para a como dar outras com prioridades mais altas, mesmo se a QoS entregue para as últimas esteja acima da desejada, e a QoS das primeiras esteja abaixo da esperada. Além disso, requisições com mesma prioridade e que competem pelo mesmo recurso podem experimentar QoSs bem diferentes, visto que algumas delas podem sempre executar enquanto outras permanecem sempre pendentes. Este trabalho apresenta uma política de escalonamento que é orientada pela QoS prometida para as requisições. Esta segue uma nova abordagem de preempção na qual qualquer requisição cuja QoS atual esteja excedendo sua respectiva meta pode ter seus recursos preemptados em benefício de outras com QoS abaixo da meta (ou que estejam mais próximas de ter seus SLOs não satisfeitos). Os benefícios de usar uma política orientada por QoS são :(i) ela mantém a QoS de cada requisição a mais alta possível, considerando suas respectivas metas e recursos disponíveis; e (ii) ela minimiza a variância da QoS entregue para requisições de uma mesma classe, promovendo o provisionamento justo. Essas características permitem a definição de SLAs que são mais apropriados e que estão de acordo com os principais provedores de nuvem pública. A política proposta foi avaliada através de comparações entre seus resultados e os obtidos com um escalonador que representa o estado-da-prática, baseado em prioridade. Esta comparação se deu por experimentos de simulação—validados por experimentos de medição alimentados por amostras de rastros de execução de um sistema em produção. No geral, o escalonamento orientado por QoS entrega um serviço melhor que o baseado em prioridade, especialmente quando a contenção de recursos não é tão alta. A similaridade da QoS entregue para requisições de uma mesma classe também foi muito mais alta quando o escalonamento orientado por QoS foi utilizado, particularmente quando nem todas as requisições receberam a QoS prometida. Além disso, com base na prática atual de grandes provedores públicos, os resultados mostraram que as penalidades incorridas pelo uso do escalonador baseado em prioridade podem ser, em média, até aproximadamente 2 vezes mais altas que aquelas incorridas pelo escalonador orientado por QoS. Por fim, o custo operacional do escalonador orientado por QoS foi aproximadamente 15 vezes maior. Porém, ainda há espaço para a implementação de otimizações, tal como um mecanismo de cache já implementado no escalonamento base a do em prioridade. A nova política ainda se mostrou viável de ser implementada em um sistema real. As métricas utilizadas por seu escalonador foram definidas de forma que a política opere no sistema sem interferir na forma como os usuários interagem como mesmo.
publishDate 2020
dc.date.none.fl_str_mv 2020-02-18
2020-04-07T16:03:54Z
2020-04-07
2020-04-07T16:03:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702
SILVA, G. F. da. Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem. 2020. 145 f. Tese (Doutorado em Sistemas e Computação), Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2020. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702
identifier_str_mv SILVA, G. F. da. Escalonamento orientado por qualidade de serviço em infraestruturas de computação na nuvem. 2020. 145 f. Tese (Doutorado em Sistemas e Computação), Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2020. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12702
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744442805977088