Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse

Detalhes bibliográficos
Autor(a) principal: Almeida, Eduardo Cunha de
Data de Publicação: 2004
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/662
Resumo: Orientador: Marcos Sfair Sunye
id UFPR_cbb84425d3907f20b0bf664e577a4c80
oai_identifier_str oai:acervodigital.ufpr.br:1884/662
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSunye, Marcos Sfair, 1964-Almeida, Eduardo Cunha de2024-02-09T20:07:22Z2024-02-09T20:07:22Z2004https://hdl.handle.net/1884/662Orientador: Marcos Sfair SunyeDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 2004Inclui bibliografiaResumo: O mundo empresarial necessita cada vez mais de instrumentos que melhorem a tomada de decisões diante do mercado competitivo. Porém, nem todas as empresas dispõem de recursos para a aquisição dos sistemas existentes e consolidados que o mercado oferece, face o seu alto custo. Esta dificuldade pode ser estendida a outros segmentos, como o governo e universidades, que também necessitam de dinamismo nas tomadas de decisões. Este trabalho é dedicado ao estudo da viabilidade de uma plataforma de baixo custo para data warehouse capaz de atender a esta clientela. Consideramos como plataforma de baixo custo a utilização de software de código aberto PostgreSQL e GNU/Linux. As características do PostgreSQL são brevemente descritas e apresentadas sugestões de implementações que podem aumentar o desempenho deste SGBD em ambientes de data warehousing. Para verificar a viabilidade desta plataforma em um ambiente de data warehousing, executamos benchmarks que são medições do desempenho de um sistema sob uma carga de trabalho. Neste trabalho foram utilizados os benchmarks TPC-H e DBT3 que simulam a carga de trabalho de um data warehousing. Estes benchmarks cobrem um ambiente multiusuario com consultas que realizam operações complexas, como por exemplo, agregações, sub-consultas aninhadas, múltiplas junções, sub-consultas dentro da clausula FROM, entre outras. Com os resultados aferidos foi possível apontar as dificuldades que o SGBD PostgreSQL teve na execução do TPC-H, motivo pelo qual executamos o DBT3 demonstrando a inviabilidade de utilizar o PostgreSQL versão 7.x como SGBD para data warehouse. Finalmente, em face dos resultados deste estudo, são sugeridas implementações para que este SGBD possa ser utilizado sem restrições em um projeto de data warehouse.Abstract: Often corporations need tools that increase the power of decisions in a competitive market. Facing that, several companies does not have resources to buy the commercial systems because of the high costs. This problem can be extended to other segments like government and universities. This work is dedicated to a feasibility study of a low cost platform to data warehouse to supply these customers. We consider as a low cost platform the use of open source software like DBMS PostgreSQL and GNU/Linux operational system. The PostgreSQL’s features are briefly presented and suggestions of implementations to increase data warehouse performance in this DBMS are pointed. We verify the feasibility of a data warehouse on this platform by executing benchmarks that serves as a point of reference. In this work we used TPC-H and DBT3 benchmarks that simulate a data warehouse workload. These benchmarks simulate multi-user environment and run complex queries, which executes: aggregations, nested sub queries, multi joins, in-line views and more. Considering the results we were able to highlight the PostgreSQL’s problems in the TPC-H execution, these problems were the main reason to execute the DBT3 benchmark and the reason to invalidate the use of PostgreSQL version 7.x as a data warehouse DBMS. Finally we make suggestions of implementations to this DBMS becomes available without reservations in data warehouse projects.79f. : il.application/pdfDisponível em formato digitalBanco de dados - GerenciaCiência da ComputaçãoEstudo de viabilidade de uma plataforma de baixo custo para Data Warehouseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALEduardo_Cunha_de_Almeida.pdfapplication/pdf531960https://acervodigital.ufpr.br/bitstream/1884/662/1/Eduardo_Cunha_de_Almeida.pdf133cd61b9a2d5e4f28f28b102481af3dMD51open accessTEXTEduardo_Cunha_de_Almeida.pdf.txtExtracted texttext/plain129418https://acervodigital.ufpr.br/bitstream/1884/662/2/Eduardo_Cunha_de_Almeida.pdf.txtd606ff8b6db3f35844a803d23e8f77ccMD52open accessTHUMBNAILEduardo_Cunha_de_Almeida.pdf.jpgGenerated Thumbnailimage/jpeg1216https://acervodigital.ufpr.br/bitstream/1884/662/3/Eduardo_Cunha_de_Almeida.pdf.jpg03593dac5bb506247cfaad338e897a1eMD53open access1884/6622024-02-09 17:07:22.75open accessoai:acervodigital.ufpr.br:1884/662Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-02-09T20:07:22Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
title Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
spellingShingle Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
Almeida, Eduardo Cunha de
Banco de dados - Gerencia
Ciência da Computação
title_short Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
title_full Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
title_fullStr Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
title_full_unstemmed Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
title_sort Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
author Almeida, Eduardo Cunha de
author_facet Almeida, Eduardo Cunha de
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Sunye, Marcos Sfair, 1964-
dc.contributor.author.fl_str_mv Almeida, Eduardo Cunha de
contributor_str_mv Sunye, Marcos Sfair, 1964-
dc.subject.por.fl_str_mv Banco de dados - Gerencia
Ciência da Computação
topic Banco de dados - Gerencia
Ciência da Computação
description Orientador: Marcos Sfair Sunye
publishDate 2004
dc.date.issued.fl_str_mv 2004
dc.date.accessioned.fl_str_mv 2024-02-09T20:07:22Z
dc.date.available.fl_str_mv 2024-02-09T20:07:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/662
url https://hdl.handle.net/1884/662
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 79f. : il.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/662/1/Eduardo_Cunha_de_Almeida.pdf
https://acervodigital.ufpr.br/bitstream/1884/662/2/Eduardo_Cunha_de_Almeida.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/662/3/Eduardo_Cunha_de_Almeida.pdf.jpg
bitstream.checksum.fl_str_mv 133cd61b9a2d5e4f28f28b102481af3d
d606ff8b6db3f35844a803d23e8f77cc
03593dac5bb506247cfaad338e897a1e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860606257528832