Caracterização do consumo energético do Hadoop MapReduce
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/86161 |
Resumo: | O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla. |
id |
UFRGS-2_8311f51d9e5b06d577fefd611856eb4c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/86161 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Rodrigues, Flavio AllesGeyer, Claudio Fernando ResinMarcos, Pedro de Botelho2014-01-18T01:53:57Z2013http://hdl.handle.net/10183/86161000910202O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla.The exponential growth of computing power, sources of data generation and communication capabilities in recent technologies created a new category of computer applications: data-intensive applications. The increase of data sets can be found in inumerous areas of human activities and knowledge. In such a context, arises a necessity of developing frameworks capable of storing and processing large-scale data in an acceptable time. MapReduce, developed by Google, is a parallel programming model with an associated implementation created for the the processing of vasts amounts of data. The user of this framework has only to define two functions (map and reduce) and the runtime deals with issues that arise due to the parallelization of the computation, such as data distribution, task scheduling, process communication and fault tolerance. However, this demand for the processing of growing amounts of data results in a higher demand for computing resources to process a single application. The major problem that this growing demand for computing resources generates is an increasing energy consumption. This is critical for two reasons - one of financial motivation and the other of environmental motivation. For these reasons, it is imperative that computer systems are designed to be aware of energy consumption. Motivated by these considerations, this study aims to characterize the power consumption of a system for processing large amounts of data. Hadoop - an open source implementation of the MapReduce programming model - is the chosen system for the proposed characterization. The energy consumption characterization of this system is accompanied by performance considerations of the framework so that energy consumption is not considered as an isolated issue, but in a broader perspective.application/pdfporComputação em gradeArquitetura : ComputadoresData-intensive computingMapReduceGreen computingEnergy consumptionCaracterização do consumo energético do Hadoop MapReduceCharacterization of Hadoop’s MapReduce energetic consumption info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2013Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000910202.pdf000910202.pdfTexto completoapplication/pdf1362504http://www.lume.ufrgs.br/bitstream/10183/86161/1/000910202.pdf084a31da22e9c60d32059c96574cb1a6MD51TEXT000910202.pdf.txt000910202.pdf.txtExtracted Texttext/plain137247http://www.lume.ufrgs.br/bitstream/10183/86161/2/000910202.pdf.txtb2f7cd05678060c633c63de28cd73b2dMD52THUMBNAIL000910202.pdf.jpg000910202.pdf.jpgGenerated Thumbnailimage/jpeg1045http://www.lume.ufrgs.br/bitstream/10183/86161/3/000910202.pdf.jpgcfa4efd3037d468790fb6d69352f691dMD5310183/861612018-10-08 08:23:40.125oai:www.lume.ufrgs.br:10183/86161Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-10-08T11:23:40Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Caracterização do consumo energético do Hadoop MapReduce |
dc.title.alternative.en.fl_str_mv |
Characterization of Hadoop’s MapReduce energetic consumption |
title |
Caracterização do consumo energético do Hadoop MapReduce |
spellingShingle |
Caracterização do consumo energético do Hadoop MapReduce Rodrigues, Flavio Alles Computação em grade Arquitetura : Computadores Data-intensive computing MapReduce Green computing Energy consumption |
title_short |
Caracterização do consumo energético do Hadoop MapReduce |
title_full |
Caracterização do consumo energético do Hadoop MapReduce |
title_fullStr |
Caracterização do consumo energético do Hadoop MapReduce |
title_full_unstemmed |
Caracterização do consumo energético do Hadoop MapReduce |
title_sort |
Caracterização do consumo energético do Hadoop MapReduce |
author |
Rodrigues, Flavio Alles |
author_facet |
Rodrigues, Flavio Alles |
author_role |
author |
dc.contributor.author.fl_str_mv |
Rodrigues, Flavio Alles |
dc.contributor.advisor1.fl_str_mv |
Geyer, Claudio Fernando Resin |
dc.contributor.advisor-co1.fl_str_mv |
Marcos, Pedro de Botelho |
contributor_str_mv |
Geyer, Claudio Fernando Resin Marcos, Pedro de Botelho |
dc.subject.por.fl_str_mv |
Computação em grade Arquitetura : Computadores |
topic |
Computação em grade Arquitetura : Computadores Data-intensive computing MapReduce Green computing Energy consumption |
dc.subject.eng.fl_str_mv |
Data-intensive computing MapReduce Green computing Energy consumption |
description |
O crescimento exponencial do poder computacional, das fontes de geração de dados e da capacidade de comunicação em tecnologias recentes criou uma nova categoria de aplicações computacionais: aplicações intensivas em dados. O aumento dos conjuntos de dados é verificado em diversas áreas do conhecimento e atuação humanas. Deste contexto surge a necessidade do desenvolvimento de frameworks capazes de armazenar e processar dados em larga escala em um tempo aceitável. MapReduce, desenvolvido pelo Google, é um modelo de programação paralelo com uma implementação associada criado para o processamento de grandes quantidades de dados. O usuário deste framework precisa definir somente duas funções (map e reduce) e o runtime se encarrega de lidar de forma transparente ao programador com questões advindas da paralelização da computação, como a distribuição dos dados, escalonamento de tarefas, comunicação entre processos e tolerância a falhas. Porém, esta demanda pelo processamento de quantidades crescentes de dados tem como consequência uma demanda maior por recursos computacionais para processar uma mesma aplicação. O grande problema que esta demanda crescente por recursos computacionais gera é um - também - crescente consumo energético. Esta situação é crítica por duas razões - uma de motivação financeira e outra de motivação ambiental. Por estas razões, é imperativo que sistemas computacionais sejam projetados para serem cientes do consumo energético. A partir destas considerações, este trabalho tem como objetivo caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados. Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização. A caracterização do consumo de energia deste sistema é acompanhada de considerações sobre o desempenho do framework para que o consumo de energia não seja considerado de maneira isolada e, sim, sob uma perspectiva mais ampla. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013 |
dc.date.accessioned.fl_str_mv |
2014-01-18T01:53:57Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/86161 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000910202 |
url |
http://hdl.handle.net/10183/86161 |
identifier_str_mv |
000910202 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/86161/1/000910202.pdf http://www.lume.ufrgs.br/bitstream/10183/86161/2/000910202.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/86161/3/000910202.pdf.jpg |
bitstream.checksum.fl_str_mv |
084a31da22e9c60d32059c96574cb1a6 b2f7cd05678060c633c63de28cd73b2d cfa4efd3037d468790fb6d69352f691d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447118744125440 |