Benchmark de tecnologias de cloud data warehouse existentes no mercado atual
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/88533 |
Resumo: | Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação |
id |
RCAP_6e898d13162ae43d5f2761d1e7d22f0c |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/88533 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atualBenchmark of cloud data warehouse technologies existing in the current marketArmazenamento de dadosComputação em nuvemTecnologias de armazenamento de dados na nuvemCloud computingData warehouseCloud data warehouse technologiesEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado integrado em Engenharia e Gestão de Sistemas de InformaçãoAo longo das últimas duas décadas a forma como os recursos de computação são desenvolvidos, implementados, atualizados e pagos foi drasticamente alterada, onde cada vez mais as soluções de software e hardware são transferidas para tecnologias cloud. Os Data Warehouses (DW), definidos como uma forma de organizar os dados corporativos de maneira integrada, num histórico variável no tempo e de modo a gerar uma única fonte de dados, também foram afetados com esta evolução, surgindo assim o conceito de Cloud Data Warehouse (CDW). Esta tecnologia permite que os utilizadores sejam mais livres tecnologicamente, pois não necessitam de despender tempo a investir em software e hardware, pagam apenas pelos recursos utilizados e a infraestrutura em si apresenta uma maior flexibilidade e escalabilidade. No entanto, selecionar a tecnologia mais adequada para um CDW pode ser uma tarefa complexa, devido ao grande número de fatores que podem influenciar a decisão e devido à oferta existente no mercado, e as empresas devem estudar e entender cada plataforma antes da sua tomada de decisão final, de modo a selecionarem o que melhor corresponde aos seus requisitos. O objetivo da presente dissertação é a análise de um conjunto de plataformas de CDW presentes no mercado atual, com o objetivo de realizar um benchmarking entre estas, após a construção de um ambiente de CDW em cada uma, apurando assim as suas vantagens e desvantagens. Essas plataformas são, respetivamente, o Snowflake, o Google BigQuery, o Amazon Redshift, o Azure Synapse. Para tal, serão analisadas e investigadas características tais como arquitetura, escalabilidade, segurança e conformidade, suporte de dados e preços, e ainda medidas e avaliadas métricas como o tempo de carregamento de dados e de execução de queries. Todo o processo de construção dos CDW e avaliação do seu desempenho encontra-se descrito no presente documento.Over the past two decades, the way computing resources are developed, deployed, upgraded, and paid for has changed dramatically, with more and more software and hardware solutions being transferred to cloud technologies. Data Warehouses (DW), defined as a way of organizing corporate data in an integrated manner, in a variable history over time and in order to generate a single data source, were also affected by this evolution, thus giving rise to the concept of Cloud Data Warehouse (CDW). This technology allows users to be more technologically free, as they do not need to spend time investing in software and hardware, they only pay for the resources used and the infrastructure itself has greater flexibility and scalability. However, selecting the most suitable technology for a CDW can be a complex task, due to the large number of factors that can influence the decision and due to the existing offer in the market, and companies must study and understand each platform before their final decision, in order to select the one that best matches their requirements. The objective of this dissertation is to analyze a set of CDW platforms present in the current market, with the objective of performing a benchmarking between them, after building a CDW environment in each one, thus determining their advantages and disadvantages. These platforms are, respectively, Snowflake, Google BigQuery, Amazon Redshift, and Azure Synapse. To this end, characteristics such as architecture, scalability, security and compliance, data support, and pricing will be analyzed and investigated, as well as metrics such as data loading and query execution times. The entire process of building CDWs and evaluating their performance is described in this document.Oliveira e Sá, JorgeUniversidade do MinhoGonçalves, Renata do Carmo2022-11-182022-11-18T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/88533por203245466info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-05-11T05:54:25Zoai:repositorium.sdum.uminho.pt:1822/88533Portal AgregadorONGhttps://www.rcaap.pt/oai/openairemluisa.alvim@gmail.comopendoar:71602024-05-11T05:54:25Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual Benchmark of cloud data warehouse technologies existing in the current market |
title |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
spellingShingle |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual Gonçalves, Renata do Carmo Armazenamento de dados Computação em nuvem Tecnologias de armazenamento de dados na nuvem Cloud computing Data warehouse Cloud data warehouse technologies Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
title_full |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
title_fullStr |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
title_full_unstemmed |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
title_sort |
Benchmark de tecnologias de cloud data warehouse existentes no mercado atual |
author |
Gonçalves, Renata do Carmo |
author_facet |
Gonçalves, Renata do Carmo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira e Sá, Jorge Universidade do Minho |
dc.contributor.author.fl_str_mv |
Gonçalves, Renata do Carmo |
dc.subject.por.fl_str_mv |
Armazenamento de dados Computação em nuvem Tecnologias de armazenamento de dados na nuvem Cloud computing Data warehouse Cloud data warehouse technologies Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Armazenamento de dados Computação em nuvem Tecnologias de armazenamento de dados na nuvem Cloud computing Data warehouse Cloud data warehouse technologies Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-11-18 2022-11-18T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/88533 |
url |
https://hdl.handle.net/1822/88533 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
203245466 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
mluisa.alvim@gmail.com |
_version_ |
1817544782187069440 |