Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse
Autor(a) principal: | |
---|---|
Data de Publicação: | 2004 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | https://hdl.handle.net/1884/662 |
Resumo: | Orientador: Marcos Sfair Sunye |
id |
UFPR_cbb84425d3907f20b0bf664e577a4c80 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/662 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSunye, Marcos Sfair, 1964-Almeida, Eduardo Cunha de2024-02-09T20:07:22Z2024-02-09T20:07:22Z2004https://hdl.handle.net/1884/662Orientador: Marcos Sfair SunyeDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 2004Inclui bibliografiaResumo: O mundo empresarial necessita cada vez mais de instrumentos que melhorem a tomada de decisões diante do mercado competitivo. Porém, nem todas as empresas dispõem de recursos para a aquisição dos sistemas existentes e consolidados que o mercado oferece, face o seu alto custo. Esta dificuldade pode ser estendida a outros segmentos, como o governo e universidades, que também necessitam de dinamismo nas tomadas de decisões. Este trabalho é dedicado ao estudo da viabilidade de uma plataforma de baixo custo para data warehouse capaz de atender a esta clientela. Consideramos como plataforma de baixo custo a utilização de software de código aberto PostgreSQL e GNU/Linux. As características do PostgreSQL são brevemente descritas e apresentadas sugestões de implementações que podem aumentar o desempenho deste SGBD em ambientes de data warehousing. Para verificar a viabilidade desta plataforma em um ambiente de data warehousing, executamos benchmarks que são medições do desempenho de um sistema sob uma carga de trabalho. Neste trabalho foram utilizados os benchmarks TPC-H e DBT3 que simulam a carga de trabalho de um data warehousing. Estes benchmarks cobrem um ambiente multiusuario com consultas que realizam operações complexas, como por exemplo, agregações, sub-consultas aninhadas, múltiplas junções, sub-consultas dentro da clausula FROM, entre outras. Com os resultados aferidos foi possível apontar as dificuldades que o SGBD PostgreSQL teve na execução do TPC-H, motivo pelo qual executamos o DBT3 demonstrando a inviabilidade de utilizar o PostgreSQL versão 7.x como SGBD para data warehouse. Finalmente, em face dos resultados deste estudo, são sugeridas implementações para que este SGBD possa ser utilizado sem restrições em um projeto de data warehouse.Abstract: Often corporations need tools that increase the power of decisions in a competitive market. Facing that, several companies does not have resources to buy the commercial systems because of the high costs. This problem can be extended to other segments like government and universities. This work is dedicated to a feasibility study of a low cost platform to data warehouse to supply these customers. We consider as a low cost platform the use of open source software like DBMS PostgreSQL and GNU/Linux operational system. The PostgreSQL’s features are briefly presented and suggestions of implementations to increase data warehouse performance in this DBMS are pointed. We verify the feasibility of a data warehouse on this platform by executing benchmarks that serves as a point of reference. In this work we used TPC-H and DBT3 benchmarks that simulate a data warehouse workload. These benchmarks simulate multi-user environment and run complex queries, which executes: aggregations, nested sub queries, multi joins, in-line views and more. Considering the results we were able to highlight the PostgreSQL’s problems in the TPC-H execution, these problems were the main reason to execute the DBT3 benchmark and the reason to invalidate the use of PostgreSQL version 7.x as a data warehouse DBMS. Finally we make suggestions of implementations to this DBMS becomes available without reservations in data warehouse projects.79f. : il.application/pdfDisponível em formato digitalBanco de dados - GerenciaCiência da ComputaçãoEstudo de viabilidade de uma plataforma de baixo custo para Data Warehouseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALEduardo_Cunha_de_Almeida.pdfapplication/pdf531960https://acervodigital.ufpr.br/bitstream/1884/662/1/Eduardo_Cunha_de_Almeida.pdf133cd61b9a2d5e4f28f28b102481af3dMD51open accessTEXTEduardo_Cunha_de_Almeida.pdf.txtExtracted texttext/plain129418https://acervodigital.ufpr.br/bitstream/1884/662/2/Eduardo_Cunha_de_Almeida.pdf.txtd606ff8b6db3f35844a803d23e8f77ccMD52open accessTHUMBNAILEduardo_Cunha_de_Almeida.pdf.jpgGenerated Thumbnailimage/jpeg1216https://acervodigital.ufpr.br/bitstream/1884/662/3/Eduardo_Cunha_de_Almeida.pdf.jpg03593dac5bb506247cfaad338e897a1eMD53open access1884/6622024-02-09 17:07:22.75open accessoai:acervodigital.ufpr.br:1884/662Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-02-09T20:07:22Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
title |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
spellingShingle |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse Almeida, Eduardo Cunha de Banco de dados - Gerencia Ciência da Computação |
title_short |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
title_full |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
title_fullStr |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
title_full_unstemmed |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
title_sort |
Estudo de viabilidade de uma plataforma de baixo custo para Data Warehouse |
author |
Almeida, Eduardo Cunha de |
author_facet |
Almeida, Eduardo Cunha de |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
dc.contributor.advisor1.fl_str_mv |
Sunye, Marcos Sfair, 1964- |
dc.contributor.author.fl_str_mv |
Almeida, Eduardo Cunha de |
contributor_str_mv |
Sunye, Marcos Sfair, 1964- |
dc.subject.por.fl_str_mv |
Banco de dados - Gerencia Ciência da Computação |
topic |
Banco de dados - Gerencia Ciência da Computação |
description |
Orientador: Marcos Sfair Sunye |
publishDate |
2004 |
dc.date.issued.fl_str_mv |
2004 |
dc.date.accessioned.fl_str_mv |
2024-02-09T20:07:22Z |
dc.date.available.fl_str_mv |
2024-02-09T20:07:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/662 |
url |
https://hdl.handle.net/1884/662 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
79f. : il. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/662/1/Eduardo_Cunha_de_Almeida.pdf https://acervodigital.ufpr.br/bitstream/1884/662/2/Eduardo_Cunha_de_Almeida.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/662/3/Eduardo_Cunha_de_Almeida.pdf.jpg |
bitstream.checksum.fl_str_mv |
133cd61b9a2d5e4f28f28b102481af3d d606ff8b6db3f35844a803d23e8f77cc 03593dac5bb506247cfaad338e897a1e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1813898802419990528 |