Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/253484 |
Resumo: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia de Controle e Automação. |
id |
UFSC_ff5db22733531be57ea836719411e59c |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/253484 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejoBig DataComputação DistribuídaData WarehouseData LakehouseTCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia de Controle e Automação.Dada a alta competitividade do setor de varejo com o advento dos mercados eletrônicos (e-commerce), as empresas buscam otimizar seus processos de venda, atração e retenção de clientes com o uso da análise de grandes volumes de dados históricos almejando se destacar frente aos seus concorrentes. Entender o comportamento do consumidor e agilizar a tomada de decisões são elementos chave para o sucesso de um negócio. Esse projeto aborda os desafios de uma grande empresa do varejo na implementação de uma arquitetura de engenharia de dados que se utiliza de tecnologias modernas como a replicação de bases de dados em tempo real, processamento distribuído de altos volumes de dados e disponibilização democrática de informação para os stakeholders, analistas de inteligência de negócio e para modelos de Inteligência Artificial e Aprendizado de Máquina na forma de tabelas agregadas com dados de vendas, fretes, parceiros, notas fiscais, remessas, entre outras a partir de bases históricas existentes, representando um complexo problema de computação dado o volume de dados. A plataforma construída será utilizada pela empresa cliente do projeto de forma a concedê-la ganhos significativos em performance de consultas, rapidez na tomada de decisões de negócios, eficiência operacional, cálculo de indicadores chave como a taxa de churn de clientes, valor vitalício por cliente, comissão de parceiros, tendências de venda e muitos outros. Esse estudo se propõe como um guia para empresas que buscam aprimorar suas estratégias e cultura de dados não só no contexto do varejo, mas em qualquer área de negócio que possa se beneficiar da tomada de decisão baseada em dados, abrangendo conceitos, dificuldades, limitações e custos envolvidos na implementação de uma arquitetura moderna de dados.Given the high competitiveness of the retail sector with the advent of electronic markets (e-commerce), companies are seeking to optimize their sales processes, attraction and retention of customers through the analysis of large volumes of historical data, aiming to stand out from their competitors. Understanding consumer behavior and speeding up decision-making are key elements for the success of a business. This project addresses the challenges of a large retail company in implementing a data engineering architecture that makes use of modern technologies such as real-time database replication, distributed processing of high volumes of data, and democratic availability of information for stakeholders, business intelligence analysts, and Artificial Intelligence and Machine Learning models in the form of aggregated tables with data on sales, freight, partners, invoices, shipments, among others from existing historical bases, representing a complex computing problem given the volume of data. The proposed platform will be used by the client company to grant it significant gains in query performance, speed in business decision-making, operational efficiency, calculation of key indicators such as customer churn rate, lifetime value per customer, partner commission, sales trends, and many others. This study serves as a guide for companies looking to improve their data strategies and data culture not only in the retail context but in any business area that can benefit from data-driven decision-making, covering concepts, difficulties, limitations and costs involved in implementing a modern data architecture.Florianópolis, SCRabelo, Ricardo JoséUniversidade Federal de Santa CatarinaFernandes, Fellipe Domingues2023-12-19T13:20:10Z2023-12-19T13:20:10Z2023-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis111 f.application/pdfhttps://repositorio.ufsc.br/handle/123456789/253484Open Access.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2023-12-19T13:20:11Zoai:repositorio.ufsc.br:123456789/253484Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732023-12-19T13:20:11Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
title |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
spellingShingle |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo Fernandes, Fellipe Domingues Big Data Computação Distribuída Data Warehouse Data Lakehouse |
title_short |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
title_full |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
title_fullStr |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
title_full_unstemmed |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
title_sort |
Implementação de uma arquitetura de processamento distribuído de grandes volumes de dados em uma empresa do varejo |
author |
Fernandes, Fellipe Domingues |
author_facet |
Fernandes, Fellipe Domingues |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rabelo, Ricardo José Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Fernandes, Fellipe Domingues |
dc.subject.por.fl_str_mv |
Big Data Computação Distribuída Data Warehouse Data Lakehouse |
topic |
Big Data Computação Distribuída Data Warehouse Data Lakehouse |
description |
TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Engenharia de Controle e Automação. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12-19T13:20:10Z 2023-12-19T13:20:10Z 2023-12-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/253484 |
url |
https://repositorio.ufsc.br/handle/123456789/253484 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Open Access. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Open Access. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
111 f. application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC |
publisher.none.fl_str_mv |
Florianópolis, SC |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651904120520704 |