Benchmark de tecnologias de cloud data warehouse existentes no mercado atual

Detalhes bibliográficos
Autor(a) principal: Gonçalves, Renata do Carmo
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/88533
Resumo: Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
id RCAP_6e898d13162ae43d5f2761d1e7d22f0c
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/88533
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Benchmark de tecnologias de cloud data warehouse existentes no mercado atualBenchmark of cloud data warehouse technologies existing in the current marketArmazenamento de dadosComputação em nuvemTecnologias de armazenamento de dados na nuvemCloud computingData warehouseCloud data warehouse technologiesEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoAo longo das últimas duas décadas a forma como os recursos de computação são desenvolvidos, implementados, atualizados e pagos foi drasticamente alterada, onde cada vez mais as soluções de software e hardware são transferidas para tecnologias cloud. Os Data Warehouses (DW), definidos como uma forma de organizar os dados corporativos de maneira integrada, num histórico variável no tempo e de modo a gerar uma única fonte de dados, também foram afetados com esta evolução, surgindo assim o conceito de Cloud Data Warehouse (CDW). Esta tecnologia permite que os utilizadores sejam mais livres tecnologicamente, pois não necessitam de despender tempo a investir em software e hardware, pagam apenas pelos recursos utilizados e a infraestrutura em si apresenta uma maior flexibilidade e escalabilidade. No entanto, selecionar a tecnologia mais adequada para um CDW pode ser uma tarefa complexa, devido ao grande número de fatores que podem influenciar a decisão e devido à oferta existente no mercado, e as empresas devem estudar e entender cada plataforma antes da sua tomada de decisão final, de modo a selecionarem o que melhor corresponde aos seus requisitos. O objetivo da presente dissertação é a análise de um conjunto de plataformas de CDW presentes no mercado atual, com o objetivo de realizar um benchmarking entre estas, após a construção de um ambiente de CDW em cada uma, apurando assim as suas vantagens e desvantagens. Essas plataformas são, respetivamente, o Snowflake, o Google BigQuery, o Amazon Redshift, o Azure Synapse. Para tal, serão analisadas e investigadas características tais como arquitetura, escalabilidade, segurança e conformidade, suporte de dados e preços, e ainda medidas e avaliadas métricas como o tempo de carregamento de dados e de execução de queries. Todo o processo de construção dos CDW e avaliação do seu desempenho encontra-se descrito no presente documento.Over the past two decades, the way computing resources are developed, deployed, upgraded, and paid for has changed dramatically, with more and more software and hardware solutions being transferred to cloud technologies. Data Warehouses (DW), defined as a way of organizing corporate data in an integrated manner, in a variable history over time and in order to generate a single data source, were also affected by this evolution, thus giving rise to the concept of Cloud Data Warehouse (CDW). This technology allows users to be more technologically free, as they do not need to spend time investing in software and hardware, they only pay for the resources used and the infrastructure itself has greater flexibility and scalability. However, selecting the most suitable technology for a CDW can be a complex task, due to the large number of factors that can influence the decision and due to the existing offer in the market, and companies must study and understand each platform before their final decision, in order to select the one that best matches their requirements. The objective of this dissertation is to analyze a set of CDW platforms present in the current market, with the objective of performing a benchmarking between them, after building a CDW environment in each one, thus determining their advantages and disadvantages. These platforms are, respectively, Snowflake, Google BigQuery, Amazon Redshift, and Azure Synapse. To this end, characteristics such as architecture, scalability, security and compliance, data support, and pricing will be analyzed and investigated, as well as metrics such as data loading and query execution times. The entire process of building CDWs and evaluating their performance is described in this document.Oliveira e Sá, JorgeUniversidade do MinhoGonçalves, Renata do Carmo2022-11-182022-11-18T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/88533por203245466info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-05-11T05:54:25Zoai:repositorium.sdum.uminho.pt:1822/88533Portal AgregadorONGhttps://www.rcaap.pt/oai/openairemluisa.alvim@gmail.comopendoar:71602024-05-11T05:54:25Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
Benchmark of cloud data warehouse technologies existing in the current market
title Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
spellingShingle Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
Gonçalves, Renata do Carmo
Armazenamento de dados
Computação em nuvem
Tecnologias de armazenamento de dados na nuvem
Cloud computing
Data warehouse
Cloud data warehouse technologies
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
title_full Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
title_fullStr Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
title_full_unstemmed Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
title_sort Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
author Gonçalves, Renata do Carmo
author_facet Gonçalves, Renata do Carmo
author_role author
dc.contributor.none.fl_str_mv Oliveira e Sá, Jorge
Universidade do Minho
dc.contributor.author.fl_str_mv Gonçalves, Renata do Carmo
dc.subject.por.fl_str_mv Armazenamento de dados
Computação em nuvem
Tecnologias de armazenamento de dados na nuvem
Cloud computing
Data warehouse
Cloud data warehouse technologies
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Armazenamento de dados
Computação em nuvem
Tecnologias de armazenamento de dados na nuvem
Cloud computing
Data warehouse
Cloud data warehouse technologies
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação
publishDate 2022
dc.date.none.fl_str_mv 2022-11-18
2022-11-18T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/88533
url https://hdl.handle.net/1822/88533
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203245466
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv mluisa.alvim@gmail.com
_version_ 1817544782187069440