Data processing with cross-application interference control via system-level instrumentation
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | https://tede2.pucrs.br/tede2/handle/tede/10941 |
Resumo: | O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese. |
id |
P_RS_57a7fb3491e7f24ca7a5b299e0879142 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/10941 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
De Rose, Cesar Augusto F.http://lattes.cnpq.br/6703453792017497http://lattes.cnpq.br/9200500508869891Xavier, Miguel Gomes2023-07-25T19:50:37Z2019-01-08https://tede2.pucrs.br/tede2/handle/tede/10941O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese.World’s gigantic data collection is reaching a crucial point for significant technological changes to deal with the immense variety and performance needs. While the complexities of data have been increasing, the real impact depends on the ability of extraction and transformation of these massive and varied raw data sets to uncover valuable information. Gaining insights into this information has led to the area of Big Data analytics. Data analysis has represented a major challenge in designing highly scalable resource management systems to integrate, extract and transform data into information, while maintaining users’ experience and business’ expectation. Resource management systems for Big Data generally consolidate applications and use system-level virtualization (containers) to enable resource sharing and improve efficiency, but performance still vary unpredictably due to the competition in access to shared resources like CPU, memory, disk and network. The initial intuition motivating our work is that the system-level information availability could be used to classify the interference emanate from containerized applications. We therefore conjecture that interference-aware clusters may speed up applications to accelerate Big Data analytics and improve resource-efficiency, while maintaining users’ experiences and business’ expectations. To confirm our thesis, we first studied Big Data performance needs and existing container system performance isolation weaknesses. Gaining insight from these studies to propose an container placement with interference recognition, we put all these together in an interference-aware scheduler prototype, which resulted in gains of up to 35% in scheduling performance and 42% in resource efficiency, thus, confirming the thesis.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2023-07-24T21:42:36Z No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5)Approved for entry into archive by Sarajane Pan (sarajane.pan@pucrs.br) on 2023-07-25T19:39:57Z (GMT) No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5)Made available in DSpace on 2023-07-25T19:50:37Z (GMT). No. of bitstreams: 1 MIGUEL GOMES XAVIER_TES.pdf: 2292993 bytes, checksum: 62a58d40e6a83e707d32e05b2328fbb5 (MD5) Previous issue date: 2019-01-08application/pdfhttps://tede2.pucrs.br/tede2/retrieve/188581/MIGUEL%20GOMES%20XAVIER_TES.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaBig DataResource ManagementVirtualizationHigh Performance ComputingOperating SystemsBig DataGerenciamento de RecursosSistemas OperacionaisVirtualizaçãoComputação de Alto DesempenhoCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOData processing with cross-application interference control via system-level instrumentationProcessamento de dados com controle de interferência entre aplicativos por meio de instrumentação no nível do sistema operacionalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILMIGUEL GOMES XAVIER_TES.pdf.jpgMIGUEL GOMES XAVIER_TES.pdf.jpgimage/jpeg5418https://tede2.pucrs.br/tede2/bitstream/tede/10941/4/MIGUEL+GOMES+XAVIER_TES.pdf.jpgd50559d3e1a1d9b52302f30fbb011c9dMD54TEXTMIGUEL GOMES XAVIER_TES.pdf.txtMIGUEL GOMES XAVIER_TES.pdf.txttext/plain210831https://tede2.pucrs.br/tede2/bitstream/tede/10941/3/MIGUEL+GOMES+XAVIER_TES.pdf.txt087e50603f1e0d113f01d66f403605e5MD53ORIGINALMIGUEL GOMES XAVIER_TES.pdfMIGUEL GOMES XAVIER_TES.pdfapplication/pdf2292993https://tede2.pucrs.br/tede2/bitstream/tede/10941/2/MIGUEL+GOMES+XAVIER_TES.pdf62a58d40e6a83e707d32e05b2328fbb5MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590https://tede2.pucrs.br/tede2/bitstream/tede/10941/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/109412023-07-25 20:00:16.58oai:tede2.pucrs.br:tede/10941QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2023-07-25T23:00:16Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Data processing with cross-application interference control via system-level instrumentation |
dc.title.alternative.por.fl_str_mv |
Processamento de dados com controle de interferência entre aplicativos por meio de instrumentação no nível do sistema operacional |
title |
Data processing with cross-application interference control via system-level instrumentation |
spellingShingle |
Data processing with cross-application interference control via system-level instrumentation Xavier, Miguel Gomes Big Data Resource Management Virtualization High Performance Computing Operating Systems Big Data Gerenciamento de Recursos Sistemas Operacionais Virtualização Computação de Alto Desempenho CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Data processing with cross-application interference control via system-level instrumentation |
title_full |
Data processing with cross-application interference control via system-level instrumentation |
title_fullStr |
Data processing with cross-application interference control via system-level instrumentation |
title_full_unstemmed |
Data processing with cross-application interference control via system-level instrumentation |
title_sort |
Data processing with cross-application interference control via system-level instrumentation |
author |
Xavier, Miguel Gomes |
author_facet |
Xavier, Miguel Gomes |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
De Rose, Cesar Augusto F. |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/6703453792017497 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/9200500508869891 |
dc.contributor.author.fl_str_mv |
Xavier, Miguel Gomes |
contributor_str_mv |
De Rose, Cesar Augusto F. |
dc.subject.eng.fl_str_mv |
Big Data Resource Management Virtualization High Performance Computing Operating Systems |
topic |
Big Data Resource Management Virtualization High Performance Computing Operating Systems Big Data Gerenciamento de Recursos Sistemas Operacionais Virtualização Computação de Alto Desempenho CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.por.fl_str_mv |
Big Data Gerenciamento de Recursos Sistemas Operacionais Virtualização Computação de Alto Desempenho |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
O volume de dados na rede global está atingindo uma escala sem precedentes exigindo mudanças tecnológicas em diferentes espectros da computação para lidar com a crescente necessidade de desempenho. Embora as complexidades dos dados tenham aumentado, o impacto real depende da capacidade de extração e transformação desses conjuntos maciços de dados brutos e variados para extrair informações valiosas. Obter informações sobre esses dados derivou um amplo espectro para análise de Big Data. A análise de dados representou um grande desafio ao projetar sistemas de gerenciamento de recursos altamente escaláveis para integrar, extrair e transformar dados brutos em informações, mantendo a experiência dos usuários e as expectativas dos negócios. Os sistemas de gerenciamento de recursos para Big Data geralmente consolidam aplicativos e usam virtualização em nível de sistema operacional (contêineres) para permitir o compartilhamento de recursos e melhorar a eficiência. No entanto, o desempenho ainda varia imprevisivelmente devido à competição no acesso a recursos compartilhados como CPU, memória, disco e rede. A intuição inicial que motiva o desenvolvimento desse trabalho é capacidade dos processadores modernos de disponibilizar informações que possam ser usadas para classificar a interferência emanada de aplicativos em contêiner. Portanto, conjeturamos que os clusters que interpresetam esses dados podem acelerar as aplicações no processo de análise de Big Data e melhorar a eficiência de recursos. Para confirmar nossa tese, primeiro estudamos as necessidades de desempenho de Big Data e os pontos fracos existentes no isolamento de desempenho de contêineres. Obtendo informações desses estudos para propor uma colocação de contêiner com reconhecimento de interferência, reunimos tudo isso em um protótipo de planejador com reconhecimento de interferência, que resultou em ganhos de até 35% no desempenho da programação e 42% na eficiência dos recursos, portanto, confirmando a tese. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-01-08 |
dc.date.accessioned.fl_str_mv |
2023-07-25T19:50:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://tede2.pucrs.br/tede2/handle/tede/10941 |
url |
https://tede2.pucrs.br/tede2/handle/tede/10941 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.program.fl_str_mv |
-4570527706994352458 |
dc.relation.confidence.fl_str_mv |
500 500 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
https://tede2.pucrs.br/tede2/bitstream/tede/10941/4/MIGUEL+GOMES+XAVIER_TES.pdf.jpg https://tede2.pucrs.br/tede2/bitstream/tede/10941/3/MIGUEL+GOMES+XAVIER_TES.pdf.txt https://tede2.pucrs.br/tede2/bitstream/tede/10941/2/MIGUEL+GOMES+XAVIER_TES.pdf https://tede2.pucrs.br/tede2/bitstream/tede/10941/1/license.txt |
bitstream.checksum.fl_str_mv |
d50559d3e1a1d9b52302f30fbb011c9d 087e50603f1e0d113f01d66f403605e5 62a58d40e6a83e707d32e05b2328fbb5 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765362674237440 |