Data processing with cross-application interference control via system-level instrumentation

Detalhes bibliográficos
Autor(a) principal: Xavier, Miguel Gomes
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: https://tede2.pucrs.br/tede2/handle/tede/10941
Resumo: O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese.
id P_RS_57a7fb3491e7f24ca7a5b299e0879142
oai_identifier_str oai:tede2.pucrs.br:tede/10941
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling De Rose, Cesar Augusto F.http://lattes.cnpq.br/6703453792017497http://lattes.cnpq.br/9200500508869891Xavier, Miguel Gomes2023-07-25T19:50:37Z2019-01-08https://tede2.pucrs.br/tede2/handle/tede/10941O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese.World’s gigantic data collection is reaching a crucial point for significant technological changes to deal with the immense variety and performance needs. While the complexities of data have been increasing, the real impact depends on the ability of extraction and transformation of these massive and varied raw data sets to uncover valuable information. Gaining insights into this information has led to the area of Big Data analytics. Data analysis has represented a major challenge in designing highly scalable resource management systems to integrate, extract and transform data into information, while maintaining users’ experience and business’ expectation. Resource management systems for Big Data generally consolidate applications and use system-level virtualization (containers) to enable resource sharing and improve efficiency, but performance still vary unpredictably due to the competition in access to shared resources like CPU, memory, disk and network. The initial intuition motivating our work is that the system-level information availability could be used to classify the interference emanate from containerized applications. We therefore conjecture that interference-aware clusters may speed up applications to accelerate Big Data analytics and improve resource-efficiency, while maintaining users’ experiences and business’ expectations. To confirm our thesis, we first studied Big Data performance needs and existing container system performance isolation weaknesses. Gaining insight from these studies to propose an container placement with interference recognition, we put all these together in an interference-aware scheduler prototype, which resulted in gains of up to 35% in scheduling performance and 42% in resource efficiency, thus, confirming the thesis.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2023-07-24T21:42:36Z No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5)Approved for entry into archive by Sarajane Pan (sarajane.pan@pucrs.br) on 2023-07-25T19:39:57Z (GMT) No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5)Made available in DSpace on 2023-07-25T19:50:37Z (GMT). No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5) Previous issue date: 2019-01-08application/pdfhttps://tede2.pucrs.br/tede2/retrieve/188581/MIGUEL%20GOMES%20XAVIER_TES.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaBig DataResource ManagementVirtualizationHigh Performance ComputingOperating SystemsBig DataGerenciamento de RecursosSistemas OperacionaisVirtualizaçãoComputação de Alto DesempenhoCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOData processing with cross-application interference control via system-level instrumentationProcessamento de dados com controle de interferência entre aplicativos por meio de instrumentação no nível do sistema operacionalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILMIGUEL GOMES XAVIER_TES.pdf.jpgMIGUEL GOMES XAVIER_TES.pdf.jpgimage/jpeg5418https://tede2.pucrs.br/tede2/bitstream/tede/10941/4/MIGUEL+GOMES+XAVIER_TES.pdf.jpgd50559d3e1a1d9b52302f30fbb011c9dMD54TEXTMIGUEL GOMES XAVIER_TES.pdf.txtMIGUEL GOMES XAVIER_TES.pdf.txttext/plain210831https://tede2.pucrs.br/tede2/bitstream/tede/10941/3/MIGUEL+GOMES+XAVIER_TES.pdf.txt087e50603f1e0d113f01d66f403605e5MD53ORIGINALMIGUEL GOMES XAVIER_TES.pdfMIGUEL GOMES XAVIER_TES.pdfapplication/pdf2292993https://tede2.pucrs.br/tede2/bitstream/tede/10941/2/MIGUEL+GOMES+XAVIER_TES.pdf62a58d40e6a83e707d32e05b2328fbb5MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10941/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/109412023-07-25 20:00:16.58oai:tede2.pucrs.br:tede/10941QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2023-07-25T23:00:16Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Data processing with cross-application interference control via system-level instrumentation
dc.title.alternative.por.fl_str_mv Processamento de dados com controle de interferência entre aplicativos por meio de instrumentação no nível do sistema operacional
title Data processing with cross-application interference control via system-level instrumentation
spellingShingle Data processing with cross-application interference control via system-level instrumentation
Xavier, Miguel Gomes
Big Data
Resource Management
Virtualization
High Performance Computing
Operating Systems
Big Data
Gerenciamento de Recursos
Sistemas Operacionais
Virtualização
Computação de Alto Desempenho
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Data processing with cross-application interference control via system-level instrumentation
title_full Data processing with cross-application interference control via system-level instrumentation
title_fullStr Data processing with cross-application interference control via system-level instrumentation
title_full_unstemmed Data processing with cross-application interference control via system-level instrumentation
title_sort Data processing with cross-application interference control via system-level instrumentation
author Xavier, Miguel Gomes
author_facet Xavier, Miguel Gomes
author_role author
dc.contributor.advisor1.fl_str_mv De Rose, Cesar Augusto F.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6703453792017497
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9200500508869891
dc.contributor.author.fl_str_mv Xavier, Miguel Gomes
contributor_str_mv De Rose, Cesar Augusto F.
dc.subject.eng.fl_str_mv Big Data
Resource Management
Virtualization
High Performance Computing
Operating Systems
topic Big Data
Resource Management
Virtualization
High Performance Computing
Operating Systems
Big Data
Gerenciamento de Recursos
Sistemas Operacionais
Virtualização
Computação de Alto Desempenho
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.por.fl_str_mv Big Data
Gerenciamento de Recursos
Sistemas Operacionais
Virtualização
Computação de Alto Desempenho
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese.
publishDate 2019
dc.date.issued.fl_str_mv 2019-01-08
dc.date.accessioned.fl_str_mv 2023-07-25T19:50:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://tede2.pucrs.br/tede2/handle/tede/10941
url https://tede2.pucrs.br/tede2/handle/tede/10941
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv -4570527706994352458
dc.relation.confidence.fl_str_mv 500
500
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv https://tede2.pucrs.br/tede2/bitstream/tede/10941/4/MIGUEL+GOMES+XAVIER_TES.pdf.jpg
https://tede2.pucrs.br/tede2/bitstream/tede/10941/3/MIGUEL+GOMES+XAVIER_TES.pdf.txt
https://tede2.pucrs.br/tede2/bitstream/tede/10941/2/MIGUEL+GOMES+XAVIER_TES.pdf
https://tede2.pucrs.br/tede2/bitstream/tede/10941/1/license.txt
bitstream.checksum.fl_str_mv d50559d3e1a1d9b52302f30fbb011c9d
087e50603f1e0d113f01d66f403605e5
62a58d40e6a83e707d32e05b2328fbb5
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765362674237440