Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho

Detalhes bibliográficos
Autor(a) principal: Pavan, Pablo José
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/226271
Resumo: Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos.
id URGS_a8baa9de5114371d8c0166abedca1e07
oai_identifier_str oai:www.lume.ufrgs.br:10183/226271
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Pavan, Pablo JoséNavaux, Philippe Olivier AlexandreBoito, Francieli Zanon2021-08-28T04:33:54Z2021http://hdl.handle.net/10183/226271001130700Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos.In High-Performance Computing (HPC), multiple applications compete for the available resources, mainly for the parallel file system. This concurrency often causes contention in Input/Output (I/O) operations, reducing application performance. Therefore, charac terizing supercomputer I/O operations is crucial to understanding the I/O workload and thus identifying potential bottlenecks. One way to investigate application access patterns is through the use of application I/O profiles; however, in an HPC system, these generate large amounts of data. In this context, the approach proposed in this dissertation is to characterize the I/O work load in supercomputers. Therefore, we combined profiles of I/O from different appli cations into a single dataset in order to identify and characterize the main I/O behaviors. Two approaches are applied to characterize the workload: (1) Analysis of the duration and representativeness of access patterns at the application level; (2) Analysis of the behavior of I/O operations at the system level. Thus, we analyzed the data provided by the Darshan tool collected by the Argonne Lead ership Computing Facility. The data is a collection of anonymous log files for 12 months of the year 2012 that summarize the I/O characteristics of 91,603 production scientific computing jobs executed on the IBM Intrepid Blue Gene/P supercomputer . The concept of the I/O phase was presented, which defines a time interval where an appli cation performed I/O operations. We identified that the I/O phases of the applications ran on average for 1.2 microseconds. If we consider the idle time between phases part of the phase, thus identifying the stability of an I/O phase in the application rises to 1 second. When we consider the system’s overall behavior, an individual I/O phase contains more than one operation, and its median duration is 4 microseconds. Furthermore, we were able to indicate that 50% of the time, the parallel file system worked simultaneously with four different access patterns.application/pdfengComputação : Alto desempenhoArquivos paralelosEntrada/saida : DadosI/O workload characterizationI/O BehaviorParallel I/OHigh Performance ComputingComportamento da E/S de aplicações paralelas em sistemas de alto desempenhoI/O behavior of parallel applications in high performance computing systems info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001130700.pdf.txt001130700.pdf.txtExtracted Texttext/plain116371http://www.lume.ufrgs.br/bitstream/10183/226271/2/001130700.pdf.txt4a19ec6431465bd9f236cd484465ca11MD52ORIGINAL001130700.pdfTexto completoapplication/pdf1104432http://www.lume.ufrgs.br/bitstream/10183/226271/1/001130700.pdff34979acdafb18aa4d9f9ea59195e3dcMD5110183/2262712021-09-19 04:30:20.150133oai:www.lume.ufrgs.br:10183/226271Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-09-19T07:30:20Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
dc.title.alternative.en.fl_str_mv I/O behavior of parallel applications in high performance computing systems
title Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
spellingShingle Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
Pavan, Pablo José
Computação : Alto desempenho
Arquivos paralelos
Entrada/saida : Dados
I/O workload characterization
I/O Behavior
Parallel I/O
High Performance Computing
title_short Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
title_full Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
title_fullStr Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
title_full_unstemmed Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
title_sort Comportamento da E/S de aplicações paralelas em sistemas de alto desempenho
author Pavan, Pablo José
author_facet Pavan, Pablo José
author_role author
dc.contributor.author.fl_str_mv Pavan, Pablo José
dc.contributor.advisor1.fl_str_mv Navaux, Philippe Olivier Alexandre
dc.contributor.advisor-co1.fl_str_mv Boito, Francieli Zanon
contributor_str_mv Navaux, Philippe Olivier Alexandre
Boito, Francieli Zanon
dc.subject.por.fl_str_mv Computação : Alto desempenho
Arquivos paralelos
Entrada/saida : Dados
topic Computação : Alto desempenho
Arquivos paralelos
Entrada/saida : Dados
I/O workload characterization
I/O Behavior
Parallel I/O
High Performance Computing
dc.subject.eng.fl_str_mv I/O workload characterization
I/O Behavior
Parallel I/O
High Performance Computing
description Na Computação de Alto Desempenho (CAD), um grande número de aplicações disputam pelos recursos disponíveis, principalmente pelo sistema de arquivos paralelos. Esta con corrência muitas vezes causa contenção nas operações de Entrada/Saída (E/S) reduzindo o desempenho das aplicações. Portanto, caracterizar as operações de E/S dos supercompu tadores é crucial para compreender carga de trabalho de E/S e assim identificar possíveis gargalos. Uma das formas de investigar os padrões de acesso das aplicações é através do uso de profiles de E/S das aplicações, porém, em um sistema CAD estes geram grandes quantias de dados. Nesse contexto, a abordagem proposta nesta dissertação consiste em caracterizar a carga de trabalho de E/S em supercomputadores. Para tanto, foram combinados profiles de E/S de diferentes aplicações em um único conjunto de dados com o objetivo de identificar e caracterizar os principais comportamentos de E/S. Duas abordagens são aplicadas para caracterizar a carga de trabalho: (1) Análise da duração e da representatividade dos pa drões de acesso a nível de aplicação; (2) Análise do comportamento das operações de E/S a nível de sistema. Assim, analisou-se os dados fornecidos pela ferramenta Darshan coletados pela Argonne Leadership Computing Facility e disponibilizados ao público. Os dados são uma coleção de arquivos de registros anônimos referentes a 12 meses do ano de 2012 que resumem as características de E/S de 91.603 jobs de computação científica de produção executadas no supercomputador IBM Intrepid Blue Gene/P. Foi apresentado o conceito de fase de E/S que define um intervalo de tempo onde uma aplicação realizou operações de E/S. A partir disso foi identificado que as fases de E/S das aplicações executaram em mediana por 1,2 microssegundos, se considerado o tempo ocioso entre as fases como parte da fase, identificando assim a estabilidade de uma fase de E/S na aplicação, esse valor sobe para 1 segundo. Quando considerado o comportamento global do sistema uma fase de E/S contém mais que uma operação e a duração dela em mediana é de 4 microssegundos. Além disso, conseguimos indicificar que em 50% do tempo, o sistema de arquivo paralelo trabalhou simultaneamente com 4 padrões de acesso distintos.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-08-28T04:33:54Z
dc.date.issued.fl_str_mv 2021
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/226271
dc.identifier.nrb.pt_BR.fl_str_mv 001130700
url http://hdl.handle.net/10183/226271
identifier_str_mv 001130700
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/226271/2/001130700.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/226271/1/001130700.pdf
bitstream.checksum.fl_str_mv 4a19ec6431465bd9f236cd484465ca11
f34979acdafb18aa4d9f9ea59195e3dc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085562088947712