Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos

Detalhes bibliográficos
Autor(a) principal: Inacio, Eduardo Camilo
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/132478
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.
id UFSC_135b2f42496c898dd2cb1c79176fcdd9
oai_identifier_str oai:repositorio.ufsc.br:123456789/132478
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelosComputaçãoBig dataAnalise multivariadaArquivos de computadorBanco de dadosDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.A quantidade de dados digitais gerados diariamente vem aumentando de forma significativa. Por consequência, as aplicações precisam manipular volumes de dados cada vez maiores, dos mais variados formatos e origens, em alta velocidade, sendo essa problemática denominada como Big Data. Uma vez que os dispositivos de armazenamento não acompanharam a evolução de desempenho observada em processadores e memórias principais, esses acabam se tornando os gargalos dessas aplicações. Sistemas de arquivos paralelos são soluções de software que vêm sendo amplamente adotados para mitigar as limitações de entrada e saída (E/S) encontradas nas plataformas computacionais atuais. Contudo, a utilização eficiente dessas soluções de armazenamento depende da compreensão do seu comportamento diante de diferentes condições de uso. Essa é uma tarefa particularmente desafiadora, em função do caráter multivariado do problema, ou seja, do fato de o desempenho geral do sistema depender do relacionamento e da influência de um grande conjunto de variáveis. Nesta dissertação se propõe um modelo analítico multivariado para representar o comportamento do desempenho do armazenamento em sistemas de arquivos paralelos para diferentes configurações e cargas de trabalho. Um extenso conjunto de experimentos, executados em quatro ambientes computacionais reais, foi realizado com o intuito de identificar um número significativo de variáveis relevantes, caracterizar a influência dessas variáveis no desempenho geral do sistema e construir e avaliar o modelo proposto.Como resultado do esforço de caracterização, o efeito de três fatores, não explorados em trabalhos anteriores, é apresentado. Os resultados da avaliação realizada, comparando o comportamento e valores estimados pelo modelo com o comportamento e valores medidos nos ambientes reais para diferentes cenários de uso, demonstraram que o modelo proposto obteve sucesso na representação do desempenho do sistema. Apesar de alguns desvios terem sido encontrados nos valores estimados pelo modelo, considerando o número significativamente maior de cenários de uso avaliados nessa pesquisa em comparação com propostas anteriores encontradas na literatura, a acurácia das predições foi considerada aceitável.<br>Abstract : The amount of digital data generated dialy has increased significantly.Consequently, applications need to handle increasing volumes of data, in a variety of formats and sources, with high velocity, namely Big Data problem. Since storage devices did not follow the performance evolution observed in processors and main memories, they become the bottleneck of these applications. Parallel file systems are software solutions that have been widely adopted to mitigate input and output (I/O) limitations found in current computing platforms. However, the efficient utilization of these storage solutions depends on the understanding of their behavior in different conditions of use. This is a particularly challenging task, because of the multivariate nature of the problem, namely the fact that the overall performance of the system depends on the relationship and the influence of a large set of variables. This dissertation proposes an analytical multivariate model to represent storage performance behavior in parallel file systems for different configurations and workloads. An extensive set of experiments, executed in four real computing environments, was conducted in order to identify a significant number of relevant variables, to determine the influence of these variables on overall system performance, and to build and evaluate the proposed model. As a result of the characterization effort, the effect of three factors, not explored in previous works, is presented. Results of the model evaluation, comparing the behavior and values estimated by the model with behavior and values measured in real environments for different usage scenarios, showed that the proposed model was successful in system performance representation. Although some deviations were found in the values estimated by the model, considering the significantly higher number of usage scenarios evaluated in this research work compared to previous proposals found in the literature, the accuracy of prediction was considered acceptable.Dantas, Mário Antônio RibeiroUniversidade Federal de Santa CatarinaInacio, Eduardo Camilo2015-04-29T21:10:29Z2015-04-29T21:10:29Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis96 p.| il., grafs.application/pdf332968https://repositorio.ufsc.br/xmlui/handle/123456789/132478porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-03-07T18:54:47Zoai:repositorio.ufsc.br:123456789/132478Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-03-07T18:54:47Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
title Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
spellingShingle Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
Inacio, Eduardo Camilo
Computação
Big data
Analise multivariada
Arquivos de computador
Banco de dados
title_short Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
title_full Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
title_fullStr Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
title_full_unstemmed Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
title_sort Caracterização e modelagem multivariada do desempenho de sistemas de arquivos paralelos
author Inacio, Eduardo Camilo
author_facet Inacio, Eduardo Camilo
author_role author
dc.contributor.none.fl_str_mv Dantas, Mário Antônio Ribeiro
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Inacio, Eduardo Camilo
dc.subject.por.fl_str_mv Computação
Big data
Analise multivariada
Arquivos de computador
Banco de dados
topic Computação
Big data
Analise multivariada
Arquivos de computador
Banco de dados
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.
publishDate 2015
dc.date.none.fl_str_mv 2015-04-29T21:10:29Z
2015-04-29T21:10:29Z
2015
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 332968
https://repositorio.ufsc.br/xmlui/handle/123456789/132478
identifier_str_mv 332968
url https://repositorio.ufsc.br/xmlui/handle/123456789/132478
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 96 p.| il., grafs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652328335572992