Comparativo entre diferentes soluções de processamento de dados para Big Data
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Universitário da Ânima (RUNA) |
Texto Completo: | https://repositorio.animaeducacao.com.br/handle/ANIMA/11021 |
Resumo: | A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução. |
id |
Ânima_b2c00eed910e5961a4b8a685cbc0891d |
---|---|
oai_identifier_str |
oai:repositorio.animaeducacao.com.br:ANIMA/11021 |
network_acronym_str |
Ânima |
network_name_str |
Repositório Universitário da Ânima (RUNA) |
repository_id_str |
|
spelling |
Comparativo entre diferentes soluções de processamento de dados para Big DataBig dataProcessamento em loteApache hadoopApache sparkApache flinkA quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.Morales, Aran Bey TcholakianSilva, Gabriel Benjamim da2017-12-10T17:54:38Z2020-11-29T05:52:43Z2017-12-10T17:54:38Z2020-11-29T05:52:43Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis67 f.application/pdfhttps://repositorio.animaeducacao.com.br/handle/ANIMA/11021Sistemas de Informação - Pedra BrancaFlorianópolis/ SCAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Universitário da Ânima (RUNA)instname:Ânima Educaçãoinstacron:Ânima2020-12-02T07:40:38Zoai:repositorio.animaeducacao.com.br:ANIMA/11021Repositório InstitucionalPRIhttps://repositorio.animaeducacao.com.br/oai/requestcontato@animaeducacao.com.bropendoar:2020-12-02T07:40:38Repositório Universitário da Ânima (RUNA) - Ânima Educaçãofalse |
dc.title.none.fl_str_mv |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
title |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
spellingShingle |
Comparativo entre diferentes soluções de processamento de dados para Big Data Silva, Gabriel Benjamim da Big data Processamento em lote Apache hadoop Apache spark Apache flink |
title_short |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
title_full |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
title_fullStr |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
title_full_unstemmed |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
title_sort |
Comparativo entre diferentes soluções de processamento de dados para Big Data |
author |
Silva, Gabriel Benjamim da |
author_facet |
Silva, Gabriel Benjamim da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Morales, Aran Bey Tcholakian |
dc.contributor.author.fl_str_mv |
Silva, Gabriel Benjamim da |
dc.subject.por.fl_str_mv |
Big data Processamento em lote Apache hadoop Apache spark Apache flink |
topic |
Big data Processamento em lote Apache hadoop Apache spark Apache flink |
description |
A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12-10T17:54:38Z 2017-12-10T17:54:38Z 2017 2020-11-29T05:52:43Z 2020-11-29T05:52:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.animaeducacao.com.br/handle/ANIMA/11021 |
url |
https://repositorio.animaeducacao.com.br/handle/ANIMA/11021 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Sistemas de Informação - Pedra Branca |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
67 f. application/pdf |
dc.coverage.none.fl_str_mv |
Florianópolis/ SC |
dc.source.none.fl_str_mv |
reponame:Repositório Universitário da Ânima (RUNA) instname:Ânima Educação instacron:Ânima |
instname_str |
Ânima Educação |
instacron_str |
Ânima |
institution |
Ânima |
reponame_str |
Repositório Universitário da Ânima (RUNA) |
collection |
Repositório Universitário da Ânima (RUNA) |
repository.name.fl_str_mv |
Repositório Universitário da Ânima (RUNA) - Ânima Educação |
repository.mail.fl_str_mv |
contato@animaeducacao.com.br |
_version_ |
1767415831702011904 |