Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.

Detalhes bibliográficos
Autor(a) principal: Miyazaki, Alexandre Kenta Salgueiro
Data de Publicação: 2014
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/100281
Resumo: No mundo computacional, tem-se um aumento constante na demanda de processamento. Há cada vez mais dados a serem processados, de forma que frequentemente eles exigem uma abordagem distribuída para que isto ocorra em um tempo aceitável. O MapReduce é um modelo de programação paralela, que visa facilitar o desenvolvimento deste tipo de aplicação, gerenciando grande parte dos complicadores como comunicação, tolerância a falhas, etc.. No Hadoop, framework open source mais utilizado pela comunidade científica que implementa este modelo, há dois pontos únicos de falha que podem comprometer toda a computação de um job. Tendo isso como inspiração, foi desenvolvido em um trabalho anterior a este uma nova arquitetura para o MapReduce, denominada Maresia, além de um protótipo que a utiliza. Esta arquitetura segue um modelo peer to peer para processar jobs. O objetivo deste trabalho é fazer uma avaliação aprofundada do desempenho do protótipo, analisando o seu comportamento e comparando seus resultados com testes executados em uma arquitetura Mestre/Escravo. Para um melhor comparativo foram implementadas novas funcionalidades durante o trabalho que permitem que ele tenha um fluxo de execução mais semelhante ao Hadoop. Os resultados mostram um protótipo que sofre com alguns pontos ineficientes, principalmente a transmissão de dados intermediários. Além disso, o comparativo com o Hadoop mostra que esta nova arquitetura é bastante promissora, no entanto, seu gargalo precisa ser otimizado.
id UFRGS-2_6b3e6e076e0762191d3566d581cdceef
oai_identifier_str oai:www.lume.ufrgs.br:10183/100281
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Miyazaki, Alexandre Kenta SalgueiroGeyer, Claudio Fernando ResinMarcos, Pedro de Botelho2014-08-14T02:10:22Z2014http://hdl.handle.net/10183/100281000931685No mundo computacional, tem-se um aumento constante na demanda de processamento. Há cada vez mais dados a serem processados, de forma que frequentemente eles exigem uma abordagem distribuída para que isto ocorra em um tempo aceitável. O MapReduce é um modelo de programação paralela, que visa facilitar o desenvolvimento deste tipo de aplicação, gerenciando grande parte dos complicadores como comunicação, tolerância a falhas, etc.. No Hadoop, framework open source mais utilizado pela comunidade científica que implementa este modelo, há dois pontos únicos de falha que podem comprometer toda a computação de um job. Tendo isso como inspiração, foi desenvolvido em um trabalho anterior a este uma nova arquitetura para o MapReduce, denominada Maresia, além de um protótipo que a utiliza. Esta arquitetura segue um modelo peer to peer para processar jobs. O objetivo deste trabalho é fazer uma avaliação aprofundada do desempenho do protótipo, analisando o seu comportamento e comparando seus resultados com testes executados em uma arquitetura Mestre/Escravo. Para um melhor comparativo foram implementadas novas funcionalidades durante o trabalho que permitem que ele tenha um fluxo de execução mais semelhante ao Hadoop. Os resultados mostram um protótipo que sofre com alguns pontos ineficientes, principalmente a transmissão de dados intermediários. Além disso, o comparativo com o Hadoop mostra que esta nova arquitetura é bastante promissora, no entanto, seu gargalo precisa ser otimizado.In the computational world, has been a steady increase in demand for processing. There is an increasing amount of data to be processed, that often demand a distributed approach to occurs in an acceptable time. MapReduce is a parallel programming model, which aims to ease the development of this kind of application, managing great part of the complicating factors like communication, fault tolerance, etc.. In Hadoop, the most used open source framework by the scientific community which implements this model, there are two single points of failure that can compromise the process of a job. Having this as inspiration, a previous work has designed a new MapReduce architecture, called Maresia, besides an prototype to use it. This architecture follows a peer to peer model to process jobs. The objective of this work is execute a thorough performance evaluation of the prototype, analyzing it’s behavior and comparing the results with tests performed in a Master/ Slave architecture. For a better comparison, new features has been implemented that allows it to have a workflow more similar to Hadoop. The results shows a prototype that suffers with some inefficient points, mainly the intermediate data transmission. Furthermore, the Hadoop comparison with the model shows that this architecture is quite promising, however, the bottleneck must to be optimized.application/pdfporProcessamento paraleloProcessamento distribuídoP2PMapReduceHadoopMaresiaSPOFProgramação paralelaAvaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2014Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000931685.pdf000931685.pdfTexto completoapplication/pdf1993333http://www.lume.ufrgs.br/bitstream/10183/100281/1/000931685.pdf527c7732e15ba82395ead87d98efc8ddMD51TEXT000931685.pdf.txt000931685.pdf.txtExtracted Texttext/plain149350http://www.lume.ufrgs.br/bitstream/10183/100281/2/000931685.pdf.txt5dea6bc30d0514271e5dfe0560b1d25fMD52THUMBNAIL000931685.pdf.jpg000931685.pdf.jpgGenerated Thumbnailimage/jpeg1069http://www.lume.ufrgs.br/bitstream/10183/100281/3/000931685.pdf.jpg66d2912d50019ffb26d4bc28ed15b9d1MD5310183/1002812022-02-22 05:07:53.308839oai:www.lume.ufrgs.br:10183/100281Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-02-22T08:07:53Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
title Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
spellingShingle Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
Miyazaki, Alexandre Kenta Salgueiro
Processamento paralelo
Processamento distribuído
P2P
MapReduce
Hadoop
Maresia
SPOF
Programação paralela
title_short Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
title_full Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
title_fullStr Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
title_full_unstemmed Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
title_sort Avaliação do modelo MapReduce em diferentes arquiteturas : um comparativo entre Hadoop e Maresia.
author Miyazaki, Alexandre Kenta Salgueiro
author_facet Miyazaki, Alexandre Kenta Salgueiro
author_role author
dc.contributor.author.fl_str_mv Miyazaki, Alexandre Kenta Salgueiro
dc.contributor.advisor1.fl_str_mv Geyer, Claudio Fernando Resin
dc.contributor.advisor-co1.fl_str_mv Marcos, Pedro de Botelho
contributor_str_mv Geyer, Claudio Fernando Resin
Marcos, Pedro de Botelho
dc.subject.por.fl_str_mv Processamento paralelo
Processamento distribuído
topic Processamento paralelo
Processamento distribuído
P2P
MapReduce
Hadoop
Maresia
SPOF
Programação paralela
dc.subject.eng.fl_str_mv P2P
MapReduce
Hadoop
Maresia
SPOF
Programação paralela
description No mundo computacional, tem-se um aumento constante na demanda de processamento. Há cada vez mais dados a serem processados, de forma que frequentemente eles exigem uma abordagem distribuída para que isto ocorra em um tempo aceitável. O MapReduce é um modelo de programação paralela, que visa facilitar o desenvolvimento deste tipo de aplicação, gerenciando grande parte dos complicadores como comunicação, tolerância a falhas, etc.. No Hadoop, framework open source mais utilizado pela comunidade científica que implementa este modelo, há dois pontos únicos de falha que podem comprometer toda a computação de um job. Tendo isso como inspiração, foi desenvolvido em um trabalho anterior a este uma nova arquitetura para o MapReduce, denominada Maresia, além de um protótipo que a utiliza. Esta arquitetura segue um modelo peer to peer para processar jobs. O objetivo deste trabalho é fazer uma avaliação aprofundada do desempenho do protótipo, analisando o seu comportamento e comparando seus resultados com testes executados em uma arquitetura Mestre/Escravo. Para um melhor comparativo foram implementadas novas funcionalidades durante o trabalho que permitem que ele tenha um fluxo de execução mais semelhante ao Hadoop. Os resultados mostram um protótipo que sofre com alguns pontos ineficientes, principalmente a transmissão de dados intermediários. Além disso, o comparativo com o Hadoop mostra que esta nova arquitetura é bastante promissora, no entanto, seu gargalo precisa ser otimizado.
publishDate 2014
dc.date.accessioned.fl_str_mv 2014-08-14T02:10:22Z
dc.date.issued.fl_str_mv 2014
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/100281
dc.identifier.nrb.pt_BR.fl_str_mv 000931685
url http://hdl.handle.net/10183/100281
identifier_str_mv 000931685
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/100281/1/000931685.pdf
http://www.lume.ufrgs.br/bitstream/10183/100281/2/000931685.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/100281/3/000931685.pdf.jpg
bitstream.checksum.fl_str_mv 527c7732e15ba82395ead87d98efc8dd
5dea6bc30d0514271e5dfe0560b1d25f
66d2912d50019ffb26d4bc28ed15b9d1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224469202599936