Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/226271 |
Resumo: | Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos. |
id |
URGS_a8baa9de5114371d8c0166abedca1e07 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/226271 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Pavan, Pablo JoséNavaux, Philippe Olivier AlexandreBoito, Francieli Zanon2021-08-28T04:33:54Z2021http://hdl.handle.net/10183/226271001130700Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos.In High-Performance Computing (HPC), multiple applications compete for the available resources, mainly for the parallel file system. This concurrency often causes contention in Input/Output (I/O) operations, reducing application performance. Therefore, charac terizing supercomputer I/O operations is crucial to understanding the I/O workload and thus identifying potential bottlenecks. One way to investigate application access patterns is through the use of application I/O profiles; however, in an HPC system, these generate large amounts of data. In this context, the approach proposed in this dissertation is to characterize the I/O work load in supercomputers. Therefore, we combined profiles of I/O from different appli cations into a single dataset in order to identify and characterize the main I/O behaviors. Two approaches are applied to characterize the workload: (1) Analysis of the duration and representativeness of access patterns at the application level; (2) Analysis of the behavior of I/O operations at the system level. Thus, we analyzed the data provided by the Darshan tool collected by the Argonne Lead ership Computing Facility. The data is a collection of anonymous log files for 12 months of the year 2012 that summarize the I/O characteristics of 91,603 production scientific computing jobs executed on the IBM Intrepid Blue Gene/P supercomputer . The concept of the I/O phase was presented, which defines a time interval where an appli cation performed I/O operations. We identified that the I/O phases of the applications ran on average for 1.2 microseconds. If we consider the idle time between phases part of the phase, thus identifying the stability of an I/O phase in the application rises to 1 second. When we consider the system’s overall behavior, an individual I/O phase contains more than one operation, and its median duration is 4 microseconds. Furthermore, we were able to indicate that 50% of the time, the parallel file system worked simultaneously with four different access patterns.application/pdfengComputação : Alto desempenhoArquivos paralelosEntrada/saida : DadosI/O workload characterizationI/O BehaviorParallel I/OHigh Performance ComputingComportamento da E/S de aplicações paralelas em sistemas de alto desempenhoI/O behavior of parallel applications in high performance computing systems info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001130700.pdf.txt001130700.pdf.txtExtracted Texttext/plain116371http://www.lume.ufrgs.br/bitstream/10183/226271/2/001130700.pdf.txt4a19ec6431465bd9f236cd484465ca11MD52ORIGINAL001130700.pdfTexto completoapplication/pdf1104432http://www.lume.ufrgs.br/bitstream/10183/226271/1/001130700.pdff34979acdafb18aa4d9f9ea59195e3dcMD5110183/2262712021-09-19 04:30:20.150133oai:www.lume.ufrgs.br:10183/226271Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-09-19T07:30:20Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
dc.title.alternative.en.fl_str_mv |
I/O behavior of parallel applications in high performance computing systems |
title |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
spellingShingle |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho Pavan, Pablo José Computação : Alto desempenho Arquivos paralelos Entrada/saida : Dados I/O workload characterization I/O Behavior Parallel I/O High Performance Computing |
title_short |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
title_full |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
title_fullStr |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
title_full_unstemmed |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
title_sort |
Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho |
author |
Pavan, Pablo José |
author_facet |
Pavan, Pablo José |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pavan, Pablo José |
dc.contributor.advisor1.fl_str_mv |
Navaux, Philippe Olivier Alexandre |
dc.contributor.advisor-co1.fl_str_mv |
Boito, Francieli Zanon |
contributor_str_mv |
Navaux, Philippe Olivier Alexandre Boito, Francieli Zanon |
dc.subject.por.fl_str_mv |
Computação : Alto desempenho Arquivos paralelos Entrada/saida : Dados |
topic |
Computação : Alto desempenho Arquivos paralelos Entrada/saida : Dados I/O workload characterization I/O Behavior Parallel I/O High Performance Computing |
dc.subject.eng.fl_str_mv |
I/O workload characterization I/O Behavior Parallel I/O High Performance Computing |
description |
Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-08-28T04:33:54Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/226271 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001130700 |
url |
http://hdl.handle.net/10183/226271 |
identifier_str_mv |
001130700 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/226271/2/001130700.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/226271/1/001130700.pdf |
bitstream.checksum.fl_str_mv |
4a19ec6431465bd9f236cd484465ca11 f34979acdafb18aa4d9f9ea59195e3dc |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085562088947712 |