Comparativo entre diferentes soluções de processamento de dados para Big Data

Detalhes bibliográficos
Autor(a) principal: Silva, Gabriel Benjamim da
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Universitário da Ânima (RUNA)
Texto Completo: https://repositorio.animaeducacao.com.br/handle/ANIMA/11021
Resumo: A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.
id Ânima_b2c00eed910e5961a4b8a685cbc0891d
oai_identifier_str oai:repositorio.animaeducacao.com.br:ANIMA/11021
network_acronym_str Ânima
network_name_str Repositório Universitário da Ânima (RUNA)
repository_id_str
spelling Comparativo entre diferentes soluções de processamento de dados para Big DataBig dataProcessamento em loteApache hadoopApache sparkApache flinkA quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.Morales, Aran Bey TcholakianSilva, Gabriel Benjamim da2017-12-10T17:54:38Z2020-11-29T05:52:43Z2017-12-10T17:54:38Z2020-11-29T05:52:43Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis67 f.application/pdfhttps://repositorio.animaeducacao.com.br/handle/ANIMA/11021Sistemas de Informação - Pedra BrancaFlorianópolis/ SCAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Universitário da Ânima (RUNA)instname:Ânima Educaçãoinstacron:Ânima2020-12-02T07:40:38Zoai:repositorio.animaeducacao.com.br:ANIMA/11021Repositório InstitucionalPRIhttps://repositorio.animaeducacao.com.br/oai/requestcontato@animaeducacao.com.bropendoar:2020-12-02T07:40:38Repositório Universitário da Ânima (RUNA) - Ânima Educaçãofalse
dc.title.none.fl_str_mv Comparativo entre diferentes soluções de processamento de dados para Big Data
title Comparativo entre diferentes soluções de processamento de dados para Big Data
spellingShingle Comparativo entre diferentes soluções de processamento de dados para Big Data
Silva, Gabriel Benjamim da
Big data
Processamento em lote
Apache hadoop
Apache spark
Apache flink
title_short Comparativo entre diferentes soluções de processamento de dados para Big Data
title_full Comparativo entre diferentes soluções de processamento de dados para Big Data
title_fullStr Comparativo entre diferentes soluções de processamento de dados para Big Data
title_full_unstemmed Comparativo entre diferentes soluções de processamento de dados para Big Data
title_sort Comparativo entre diferentes soluções de processamento de dados para Big Data
author Silva, Gabriel Benjamim da
author_facet Silva, Gabriel Benjamim da
author_role author
dc.contributor.none.fl_str_mv Morales, Aran Bey Tcholakian
dc.contributor.author.fl_str_mv Silva, Gabriel Benjamim da
dc.subject.por.fl_str_mv Big data
Processamento em lote
Apache hadoop
Apache spark
Apache flink
topic Big data
Processamento em lote
Apache hadoop
Apache spark
Apache flink
description A quantidade de dados digitais gerados encontra-se em constante crescimento, por isso cada vez mais se ouve falar do conceito de Big Data. O resultado da ascensão deste tema é a diversidade de soluções que acompanha este crescimento, soluções para facilitar o processamento de dados, paralelismo, processamento em tempo real, tolerância a falha e etc. Diante desta diversidade de soluções para Big Data, este trabalho tem como objetivo estudar 3 dessas ferramentas, Apache Hadoop, Apache Spark e Apache Flink, apontando diferenças, semelhanças e comparando-as por meio de um experimento de contagem de palavras diante de grande volume de dados. Assim, foi possível avaliar o tempo de processamento de cada plataforma trabalhando em modo pseudo-distribuído e em um único cluster, e observar o desempenho de cada plataforma no processamento em lote. Por fim, pode-se avaliar que o objetivo de estudo e comparação de tempo de execução foi atendido. Constatou-se que a ferramenta Spark obteve os melhores resultados para o tipo de operação realizado no experimento, além de servir como base para estudos futuros das ferramentas, utilizando novas formas de processamento e de ambiente de execução.
publishDate 2017
dc.date.none.fl_str_mv 2017-12-10T17:54:38Z
2017-12-10T17:54:38Z
2017
2020-11-29T05:52:43Z
2020-11-29T05:52:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.animaeducacao.com.br/handle/ANIMA/11021
url https://repositorio.animaeducacao.com.br/handle/ANIMA/11021
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Sistemas de Informação - Pedra Branca
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 67 f.
application/pdf
dc.coverage.none.fl_str_mv Florianópolis/ SC
dc.source.none.fl_str_mv reponame:Repositório Universitário da Ânima (RUNA)
instname:Ânima Educação
instacron:Ânima
instname_str Ânima Educação
instacron_str Ânima
institution Ânima
reponame_str Repositório Universitário da Ânima (RUNA)
collection Repositório Universitário da Ânima (RUNA)
repository.name.fl_str_mv Repositório Universitário da Ânima (RUNA) - Ânima Educação
repository.mail.fl_str_mv contato@animaeducacao.com.br
_version_ 1767415831702011904