Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/132478 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015. |
id |
UFSC_135b2f42496c898dd2cb1c79176fcdd9 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/132478 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelosComputaçãoBig dataAnalise multivariadaArquivos de computadorBanco de dadosDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.A quantidade de dados digitais gerados diariamente vem aumentando de forma significativa. Por consequência, as aplicações precisam manipular volumes de dados cada vez maiores, dos mais variados formatos e origens, em alta velocidade, sendo essa problemática denominada como Big Data. Uma vez que os dispositivos de armazenamento não acompanharam a evolução de desempenho observada em processadores e memórias principais, esses acabam se tornando os gargalos dessas aplicações. Sistemas de arquivos paralelos são soluções de software que vêm sendo amplamente adotados para mitigar as limitações de entrada e saída (E/S) encontradas nas plataformas computacionais atuais. Contudo, a utilização eficiente dessas soluções de armazenamento depende da compreensão do seu comportamento diante de diferentes condições de uso. Essa é uma tarefa particularmente desafiadora, em função do caráter multivariado do problema, ou seja, do fato de o desempenho geral do sistema depender do relacionamento e da influência de um grande conjunto de variáveis. Nesta dissertação se propõe um modelo analítico multivariado para representar o comportamento do desempenho do armazenamento em sistemas de arquivos paralelos para diferentes configurações e cargas de trabalho. Um extenso conjunto de experimentos, executados em quatro ambientes computacionais reais, foi realizado com o intuito de identificar um número significativo de variáveis relevantes, caracterizar a influência dessas variáveis no desempenho geral do sistema e construir e avaliar o modelo proposto.Como resultado do esforço de caracterização, o efeito de três fatores, não explorados em trabalhos anteriores, é apresentado. Os resultados da avaliação realizada, comparando o comportamento e valores estimados pelo modelo com o comportamento e valores medidos nos ambientes reais para diferentes cenários de uso, demonstraram que o modelo proposto obteve sucesso na representação do desempenho do sistema. Apesar de alguns desvios terem sido encontrados nos valores estimados pelo modelo, considerando o número significativamente maior de cenários de uso avaliados nessa pesquisa em comparação com propostas anteriores encontradas na literatura, a acurácia das predições foi considerada aceitável.<br>Abstract : The amount of digital data generated dialy has increased significantly.Consequently, applications need to handle increasing volumes of data, in a variety of formats and sources, with high velocity, namely Big Data problem. Since storage devices did not follow the performance evolution observed in processors and main memories, they become the bottleneck of these applications. Parallel file systems are software solutions that have been widely adopted to mitigate input and output (I/O) limitations found in current computing platforms. However, the efficient utilization of these storage solutions depends on the understanding of their behavior in different conditions of use. This is a particularly challenging task, because of the multivariate nature of the problem, namely the fact that the overall performance of the system depends on the relationship and the influence of a large set of variables. This dissertation proposes an analytical multivariate model to represent storage performance behavior in parallel file systems for different configurations and workloads. An extensive set of experiments, executed in four real computing environments, was conducted in order to identify a significant number of relevant variables, to determine the influence of these variables on overall system performance, and to build and evaluate the proposed model. As a result of the characterization effort, the effect of three factors, not explored in previous works, is presented. Results of the model evaluation, comparing the behavior and values estimated by the model with behavior and values measured in real environments for different usage scenarios, showed that the proposed model was successful in system performance representation. Although some deviations were found in the values estimated by the model, considering the significantly higher number of usage scenarios evaluated in this research work compared to previous proposals found in the literature, the accuracy of prediction was considered acceptable.Dantas, Mário Antônio RibeiroUniversidade Federal de Santa CatarinaInacio, Eduardo Camilo2015-04-29T21:10:29Z2015-04-29T21:10:29Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis96 p.| il., grafs.application/pdf332968https://repositorio.ufsc.br/xmlui/handle/123456789/132478porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-03-07T18:54:47Zoai:repositorio.ufsc.br:123456789/132478Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-03-07T18:54:47Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
title |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
spellingShingle |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos Inacio, Eduardo Camilo Computação Big data Analise multivariada Arquivos de computador Banco de dados |
title_short |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
title_full |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
title_fullStr |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
title_full_unstemmed |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
title_sort |
Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos |
author |
Inacio, Eduardo Camilo |
author_facet |
Inacio, Eduardo Camilo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dantas, Mário Antônio Ribeiro Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Inacio, Eduardo Camilo |
dc.subject.por.fl_str_mv |
Computação Big data Analise multivariada Arquivos de computador Banco de dados |
topic |
Computação Big data Analise multivariada Arquivos de computador Banco de dados |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-04-29T21:10:29Z 2015-04-29T21:10:29Z 2015 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
332968 https://repositorio.ufsc.br/xmlui/handle/123456789/132478 |
identifier_str_mv |
332968 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/132478 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
96 p.| il., grafs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652328335572992 |