Caracterização do consumo energético do Hadoop MapReduce

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Flavio Alles
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/86161
Resumo: O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla.
id UFRGS-2_8311f51d9e5b06d577fefd611856eb4c
oai_identifier_str oai:www.lume.ufrgs.br:10183/86161
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Rodrigues, Flavio AllesGeyer, Claudio Fernando ResinMarcos, Pedro de Botelho2014-01-18T01:53:57Z2013http://hdl.handle.net/10183/86161000910202O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla.The exponential growth of computing power, sources of data generation and communication capabilities in recent technologies created a new category of computer applications: data-intensive applications. The increase of data sets can be found in inumerous areas of human activities and knowledge. In such a context, arises a necessity of developing frameworks capable of storing and processing large-scale data in an acceptable time. MapReduce, developed by Google, is a parallel programming model with an associated implementation created for the the processing of vasts amounts of data. The user of this framework has only to define two functions (map and reduce) and the runtime deals with issues that arise due to the parallelization of the computation, such as data distribution, task scheduling, process communication and fault tolerance. However, this demand for the processing of growing amounts of data results in a higher demand for computing resources to process a single application. The major problem that this growing demand for computing resources generates is an increasing energy consumption. This is critical for two reasons - one of financial motivation and the other of environmental motivation. For these reasons, it is imperative that computer systems are designed to be aware of energy consumption. Motivated by these considerations, this study aims to characterize the power consumption of a system for processing large amounts of data. Hadoop - an open source implementation of the MapReduce programming model - is the chosen system for the proposed characterization. The energy consumption characterization of this system is accompanied by performance considerations of the framework so that energy consumption is not considered as an isolated issue, but in a broader perspective.application/pdfporComputação em gradeArquitetura : ComputadoresData-intensive computingMapReduceGreen computingEnergy consumptionCaracterização do consumo energético do Hadoop MapReduceCharacterization of Hadoop’s MapReduce energetic consumption info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2013Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000910202.pdf000910202.pdfTexto completoapplication/pdf1362504http://www.lume.ufrgs.br/bitstream/10183/86161/1/000910202.pdf084a31da22e9c60d32059c96574cb1a6MD51TEXT000910202.pdf.txt000910202.pdf.txtExtracted Texttext/plain137247http://www.lume.ufrgs.br/bitstream/10183/86161/2/000910202.pdf.txtb2f7cd05678060c633c63de28cd73b2dMD52THUMBNAIL000910202.pdf.jpg000910202.pdf.jpgGenerated Thumbnailimage/jpeg1045http://www.lume.ufrgs.br/bitstream/10183/86161/3/000910202.pdf.jpgcfa4efd3037d468790fb6d69352f691dMD5310183/861612018-10-08 08:23:40.125oai:www.lume.ufrgs.br:10183/86161Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-08T11:23:40Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Caracterização do consumo energético do Hadoop MapReduce
dc.title.alternative.en.fl_str_mv Characterization of Hadoop’s MapReduce energetic consumption
title Caracterização do consumo energético do Hadoop MapReduce
spellingShingle Caracterização do consumo energético do Hadoop MapReduce
Rodrigues, Flavio Alles
Computação em grade
Arquitetura : Computadores
Data-intensive computing
MapReduce
Green computing
Energy consumption
title_short Caracterização do consumo energético do Hadoop MapReduce
title_full Caracterização do consumo energético do Hadoop MapReduce
title_fullStr Caracterização do consumo energético do Hadoop MapReduce
title_full_unstemmed Caracterização do consumo energético do Hadoop MapReduce
title_sort Caracterização do consumo energético do Hadoop MapReduce
author Rodrigues, Flavio Alles
author_facet Rodrigues, Flavio Alles
author_role author
dc.contributor.author.fl_str_mv Rodrigues, Flavio Alles
dc.contributor.advisor1.fl_str_mv Geyer, Claudio Fernando Resin
dc.contributor.advisor-co1.fl_str_mv Marcos, Pedro de Botelho
contributor_str_mv Geyer, Claudio Fernando Resin
Marcos, Pedro de Botelho
dc.subject.por.fl_str_mv Computação em grade
Arquitetura : Computadores
topic Computação em grade
Arquitetura : Computadores
Data-intensive computing
MapReduce
Green computing
Energy consumption
dc.subject.eng.fl_str_mv Data-intensive computing
MapReduce
Green computing
Energy consumption
description O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla.
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2014-01-18T01:53:57Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/86161
dc.identifier.nrb.pt_BR.fl_str_mv 000910202
url http://hdl.handle.net/10183/86161
identifier_str_mv 000910202
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/86161/1/000910202.pdf
http://www.lume.ufrgs.br/bitstream/10183/86161/2/000910202.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/86161/3/000910202.pdf.jpg
bitstream.checksum.fl_str_mv 084a31da22e9c60d32059c96574cb1a6
b2f7cd05678060c633c63de28cd73b2d
cfa4efd3037d468790fb6d69352f691d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447118744125440