Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse

Detalhes bibliográficos
Autor(a) principal: Rittmann, Júlia Del Pino
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/272039
Resumo: Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria.
id UFRGS-2_cbae1771328796ef427ecea48a8497c3
oai_identifier_str oai:www.lume.ufrgs.br:10183/272039
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Rittmann, Júlia Del PinoGalante, Renata de Matos2024-02-17T04:55:29Z2023http://hdl.handle.net/10183/272039001196066Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria.In recent years, the exponential increase in data creation worldwide has drawn the attention of large companies to the importance of proper care for this valuable resource. One of the essential criteria for obtaining accurate projections and analyses of corporate data is the quality of this data, as it is crucial to ensure the integrity of the data used in any study. Although it is a relatively new topic in the market, it is crucial to consider ways to implement data quality in both small and large companies. This study aims to develop Python code to analyze three of the six recognized dimensions of data quality: completeness, compliance, and accuracy. This analysis is carried out on tables from a Data Warehouse of a Brazilian company in the retail sector. These analyses are fundamental for the proper scanning and interpretation of the databases in question, allowing for the creation of more reliable Key Performance Indicators (KPIs). The work seeks to pave the way for the improvement of data quality-related practices, demonstrate the effectiveness of applying data quality, and highlight the impact that attention to valid data percentages can have on industry corporate indicators.application/pdfporArmazenamento de dadosAnálise de dadosBanco de dadosQualidade de dados : InformáticaPythonData warehouseAnálise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data WarehouseA three-dimensional analysis of data quality in purchasing tables within a Data Warehouse environment info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001196066.pdf.txt001196066.pdf.txtExtracted Texttext/plain68153http://www.lume.ufrgs.br/bitstream/10183/272039/2/001196066.pdf.txt6611687365dbfdb7826ea18ca8d769f1MD52ORIGINAL001196066.pdfTexto completoapplication/pdf1286783http://www.lume.ufrgs.br/bitstream/10183/272039/1/001196066.pdfec821469acbec6b86a0e09ccf369bfdaMD5110183/2720392024-02-18 05:00:03.969997oai:www.lume.ufrgs.br:10183/272039Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-02-18T08:00:03Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
dc.title.alternative.en.fl_str_mv A three-dimensional analysis of data quality in purchasing tables within a Data Warehouse environment
title Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
spellingShingle Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
Rittmann, Júlia Del Pino
Armazenamento de dados
Análise de dados
Banco de dados
Qualidade de dados : Informática
Python
Data warehouse
title_short Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
title_full Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
title_fullStr Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
title_full_unstemmed Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
title_sort Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
author Rittmann, Júlia Del Pino
author_facet Rittmann, Júlia Del Pino
author_role author
dc.contributor.author.fl_str_mv Rittmann, Júlia Del Pino
dc.contributor.advisor1.fl_str_mv Galante, Renata de Matos
contributor_str_mv Galante, Renata de Matos
dc.subject.por.fl_str_mv Armazenamento de dados
Análise de dados
Banco de dados
Qualidade de dados : Informática
topic Armazenamento de dados
Análise de dados
Banco de dados
Qualidade de dados : Informática
Python
Data warehouse
dc.subject.eng.fl_str_mv Python
Data warehouse
description Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria.
publishDate 2023
dc.date.issued.fl_str_mv 2023
dc.date.accessioned.fl_str_mv 2024-02-17T04:55:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/272039
dc.identifier.nrb.pt_BR.fl_str_mv 001196066
url http://hdl.handle.net/10183/272039
identifier_str_mv 001196066
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/272039/2/001196066.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/272039/1/001196066.pdf
bitstream.checksum.fl_str_mv 6611687365dbfdb7826ea18ca8d769f1
ec821469acbec6b86a0e09ccf369bfda
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224675637854208