Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/272039 |
Resumo: | Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria. |
id |
UFRGS-2_cbae1771328796ef427ecea48a8497c3 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/272039 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Rittmann, Júlia Del PinoGalante, Renata de Matos2024-02-17T04:55:29Z2023http://hdl.handle.net/10183/272039001196066Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria.In recent years, the exponential increase in data creation worldwide has drawn the attention of large companies to the importance of proper care for this valuable resource. One of the essential criteria for obtaining accurate projections and analyses of corporate data is the quality of this data, as it is crucial to ensure the integrity of the data used in any study. Although it is a relatively new topic in the market, it is crucial to consider ways to implement data quality in both small and large companies. This study aims to develop Python code to analyze three of the six recognized dimensions of data quality: completeness, compliance, and accuracy. This analysis is carried out on tables from a Data Warehouse of a Brazilian company in the retail sector. These analyses are fundamental for the proper scanning and interpretation of the databases in question, allowing for the creation of more reliable Key Performance Indicators (KPIs). The work seeks to pave the way for the improvement of data quality-related practices, demonstrate the effectiveness of applying data quality, and highlight the impact that attention to valid data percentages can have on industry corporate indicators.application/pdfporArmazenamento de dadosAnálise de dadosBanco de dadosQualidade de dados : InformáticaPythonData warehouseAnálise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data WarehouseA three-dimensional analysis of data quality in purchasing tables within a Data Warehouse environment info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001196066.pdf.txt001196066.pdf.txtExtracted Texttext/plain68153http://www.lume.ufrgs.br/bitstream/10183/272039/2/001196066.pdf.txt6611687365dbfdb7826ea18ca8d769f1MD52ORIGINAL001196066.pdfTexto completoapplication/pdf1286783http://www.lume.ufrgs.br/bitstream/10183/272039/1/001196066.pdfec821469acbec6b86a0e09ccf369bfdaMD5110183/2720392024-02-18 05:00:03.969997oai:www.lume.ufrgs.br:10183/272039Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2024-02-18T08:00:03Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
dc.title.alternative.en.fl_str_mv |
A three-dimensional analysis of data quality in purchasing tables within a Data Warehouse environment |
title |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
spellingShingle |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse Rittmann, Júlia Del Pino Armazenamento de dados Análise de dados Banco de dados Qualidade de dados : Informática Python Data warehouse |
title_short |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
title_full |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
title_fullStr |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
title_full_unstemmed |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
title_sort |
Análise de três dimensões de qualidade de dados em tabelas de compras de um ambiente de Data Warehouse |
author |
Rittmann, Júlia Del Pino |
author_facet |
Rittmann, Júlia Del Pino |
author_role |
author |
dc.contributor.author.fl_str_mv |
Rittmann, Júlia Del Pino |
dc.contributor.advisor1.fl_str_mv |
Galante, Renata de Matos |
contributor_str_mv |
Galante, Renata de Matos |
dc.subject.por.fl_str_mv |
Armazenamento de dados Análise de dados Banco de dados Qualidade de dados : Informática |
topic |
Armazenamento de dados Análise de dados Banco de dados Qualidade de dados : Informática Python Data warehouse |
dc.subject.eng.fl_str_mv |
Python Data warehouse |
description |
Nos últimos anos, o aumento exponencial na criação de dados em todo o mundo tem despertado a atenção das grandes empresas para a importância de cuidados adequados com esse valioso recurso. Um dos critérios essenciais para obter projeções e análises precisas dos dados corporativos é a qualidade desses dados, uma vez que é fundamental garantir a integridade dos dados utilizados em qualquer estudo. Embora seja um tópico relativamente novo no mercado, é crucial considerar as formas de implementar a qualidade dos dados em empresas de pequeno e grande porte. Este estudo tem como objetivo desenvolver um código em Python para analisar três das seis dimensões reconhecidas da qualidade dos dados: completude, conformidade e precisão. Essa análise é realizada em tabelas de um Data Warehouse de uma empresa brasileira do setor varejista. Essas aná- lises são fundamentais para a correta varredura e interpretação das bases de dados em questão, permitindo a criação de Indicadores-Chave de Desempenho (KPIs) mais confiá- veis. O trabalho busca abrir caminho para o aprimoramento das práticas relacionadas à qualidade de dados, demonstrar a eficácia da aplicação da qualidade dos dados e evidenciar o impacto que a atenção aos percentuais de dados válidos pode ter nos indicadores corporativos da indústria. |
publishDate |
2023 |
dc.date.issued.fl_str_mv |
2023 |
dc.date.accessioned.fl_str_mv |
2024-02-17T04:55:29Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/272039 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001196066 |
url |
http://hdl.handle.net/10183/272039 |
identifier_str_mv |
001196066 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/272039/2/001196066.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/272039/1/001196066.pdf |
bitstream.checksum.fl_str_mv |
6611687365dbfdb7826ea18ca8d769f1 ec821469acbec6b86a0e09ccf369bfda |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224675637854208 |