Data lake: uma nova abordagem para o armazenamento de dados

Detalhes bibliográficos
Autor(a) principal: Rau, Isabele Aurora Cândido Vitorino
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Universitário da Ânima (RUNA)
Texto Completo: https://repositorio.animaeducacao.com.br/handle/ANIMA/13790
Resumo: Com a evolução dos sistemas e a produção massiva de dados por parte destes, nasceu um novo mercado, de dados. Tendo estes se tornados bens valiosos para as organizações e podendo serem convertidos em vantagens competitivas para as mesmas. Sucintamente, esse foi um dos motivos para o surgimento da Era do Big Data. Entretanto, as abordagens tradicionais de armazenamento de dados, mostraram limitações ao lidar com altos volumes de dados. Desse modo, surgiu a necessidade de tecnologias mais aprimoradas para armazenar e processar dados. Uma das estratégias criadas para lidar com o Big Data foi o Data Lake. Essa terminologia é abordada no decorrer do presente trabalho, assim como o conceito de Data Warehouse. São explorados os conceitos de ambas tecnologias, com o intuito de elucidar suas diferenças e semelhanças e o melhor cenário para aplicá-las. Também são apresentados dois conjuntos de software capazes de auxiliar na implementação de um ambiente de Data Lake. Sendo também demonstrado, através de um experimento, a estruturação de um ambiente de Data Lake utilizando um destes conjuntos de software. Através destes insumos é possível detectar quais aspectos devem ser considerados pelas empresas na hora de escolher o tipo de armazenamento de dados que faz mais sentido para o seu negócio.
id Ânima_0a9ad6be8d738805fb4075d918d2e400
oai_identifier_str oai:repositorio.animaeducacao.com.br:ANIMA/13790
network_acronym_str Ânima
network_name_str Repositório Universitário da Ânima (RUNA)
repository_id_str
spelling Data lake: uma nova abordagem para o armazenamento de dadosData LakeApache HadoopAmazon AWSCom a evolução dos sistemas e a produção massiva de dados por parte destes, nasceu um novo mercado, de dados. Tendo estes se tornados bens valiosos para as organizações e podendo serem convertidos em vantagens competitivas para as mesmas. Sucintamente, esse foi um dos motivos para o surgimento da Era do Big Data. Entretanto, as abordagens tradicionais de armazenamento de dados, mostraram limitações ao lidar com altos volumes de dados. Desse modo, surgiu a necessidade de tecnologias mais aprimoradas para armazenar e processar dados. Uma das estratégias criadas para lidar com o Big Data foi o Data Lake. Essa terminologia é abordada no decorrer do presente trabalho, assim como o conceito de Data Warehouse. São explorados os conceitos de ambas tecnologias, com o intuito de elucidar suas diferenças e semelhanças e o melhor cenário para aplicá-las. Também são apresentados dois conjuntos de software capazes de auxiliar na implementação de um ambiente de Data Lake. Sendo também demonstrado, através de um experimento, a estruturação de um ambiente de Data Lake utilizando um destes conjuntos de software. Através destes insumos é possível detectar quais aspectos devem ser considerados pelas empresas na hora de escolher o tipo de armazenamento de dados que faz mais sentido para o seu negócio.Vieira, DaniellaRau, Isabele Aurora Cândido Vitorino2021-07-03T00:29:59Z2021-07-03T00:29:59Z2021-06-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis72 f.application/pdfhttps://repositorio.animaeducacao.com.br/handle/ANIMA/13790FlorianópolisAtribuição-NãoComercial-CompartilhaIgual 3.0 Brasilhttp://creativecommons.org/licenses/by-nc-sa/3.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Universitário da Ânima (RUNA)instname:Ânima Educaçãoinstacron:Ânima2021-07-09T08:33:56Zoai:repositorio.animaeducacao.com.br:ANIMA/13790Repositório InstitucionalPRIhttps://repositorio.animaeducacao.com.br/oai/requestcontato@animaeducacao.com.bropendoar:2021-07-09T08:33:56Repositório Universitário da Ânima (RUNA) - Ânima Educaçãofalse
dc.title.none.fl_str_mv Data lake: uma nova abordagem para o armazenamento de dados
title Data lake: uma nova abordagem para o armazenamento de dados
spellingShingle Data lake: uma nova abordagem para o armazenamento de dados
Rau, Isabele Aurora Cândido Vitorino
Data Lake
Apache Hadoop
Amazon AWS
title_short Data lake: uma nova abordagem para o armazenamento de dados
title_full Data lake: uma nova abordagem para o armazenamento de dados
title_fullStr Data lake: uma nova abordagem para o armazenamento de dados
title_full_unstemmed Data lake: uma nova abordagem para o armazenamento de dados
title_sort Data lake: uma nova abordagem para o armazenamento de dados
author Rau, Isabele Aurora Cândido Vitorino
author_facet Rau, Isabele Aurora Cândido Vitorino
author_role author
dc.contributor.none.fl_str_mv Vieira, Daniella
dc.contributor.author.fl_str_mv Rau, Isabele Aurora Cândido Vitorino
dc.subject.por.fl_str_mv Data Lake
Apache Hadoop
Amazon AWS
topic Data Lake
Apache Hadoop
Amazon AWS
description Com a evolução dos sistemas e a produção massiva de dados por parte destes, nasceu um novo mercado, de dados. Tendo estes se tornados bens valiosos para as organizações e podendo serem convertidos em vantagens competitivas para as mesmas. Sucintamente, esse foi um dos motivos para o surgimento da Era do Big Data. Entretanto, as abordagens tradicionais de armazenamento de dados, mostraram limitações ao lidar com altos volumes de dados. Desse modo, surgiu a necessidade de tecnologias mais aprimoradas para armazenar e processar dados. Uma das estratégias criadas para lidar com o Big Data foi o Data Lake. Essa terminologia é abordada no decorrer do presente trabalho, assim como o conceito de Data Warehouse. São explorados os conceitos de ambas tecnologias, com o intuito de elucidar suas diferenças e semelhanças e o melhor cenário para aplicá-las. Também são apresentados dois conjuntos de software capazes de auxiliar na implementação de um ambiente de Data Lake. Sendo também demonstrado, através de um experimento, a estruturação de um ambiente de Data Lake utilizando um destes conjuntos de software. Através destes insumos é possível detectar quais aspectos devem ser considerados pelas empresas na hora de escolher o tipo de armazenamento de dados que faz mais sentido para o seu negócio.
publishDate 2021
dc.date.none.fl_str_mv 2021-07-03T00:29:59Z
2021-07-03T00:29:59Z
2021-06-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.animaeducacao.com.br/handle/ANIMA/13790
url https://repositorio.animaeducacao.com.br/handle/ANIMA/13790
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Atribuição-NãoComercial-CompartilhaIgual 3.0 Brasil
http://creativecommons.org/licenses/by-nc-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribuição-NãoComercial-CompartilhaIgual 3.0 Brasil
http://creativecommons.org/licenses/by-nc-sa/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 72 f.
application/pdf
dc.coverage.none.fl_str_mv Florianópolis
dc.source.none.fl_str_mv reponame:Repositório Universitário da Ânima (RUNA)
instname:Ânima Educação
instacron:Ânima
instname_str Ânima Educação
instacron_str Ânima
institution Ânima
reponame_str Repositório Universitário da Ânima (RUNA)
collection Repositório Universitário da Ânima (RUNA)
repository.name.fl_str_mv Repositório Universitário da Ânima (RUNA) - Ânima Educação
repository.mail.fl_str_mv contato@animaeducacao.com.br
_version_ 1767415831669506048