Análise multivariada de dados sobre tipologia de produtos numa empresa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/84928 |
Resumo: | Dissertação de mestrado em Matemática e Computação |
id |
RCAP_058d2b2c6fd0626aeddc6a1f28cd9fe1 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/84928 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Análise multivariada de dados sobre tipologia de produtos numa empresaMultivariate analysis of data on typology of products in a companyMachine learningPCAk-MeansClustering hierárquicoVendasHierarchical clusteringSalesCiências Naturais::MatemáticasDissertação de mestrado em Matemática e ComputaçãoAs pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior lucro. O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos de k-Means e clustering hierárquico. O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados, nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do algoritmo clustering hierárquico método ”average”.Small, medium and large companies collect their data hoping that it will somehow generate commer cial value. Machine learning has the ability to provide valuable information from data, serving as the main sales strategy for the company to achieve greater profit. The objective of this dissertation is to analyze sales data from the company Litel, Lda, seeking to extract sales patterns related to products (boxes and bags) that share similarities with each other. In order to achieve this objective, unsupervised learning methodologies are presented, which allow for a segmentation of groups, namely Principal Component Analysis (PCA), k-Means algorithms and hierarchical clustering. The PCA was used to identify correlated variables and identify hidden patterns in the data, namely product families with similar sales. The elbow, silhouette and 30 indices methods were applied to choose the best number of clusters, in order to identify the optimal number of clusters. Validation methods were also applied in order to identify the clustering algorithm with the best performance. Through the stability measures, the consistency of the clusters was evaluated, and through the cophenetic coefficient, the combination of methods that reflected a better data grouping was determined. After carrying out the previous validations, the respective clustering algorithms were implemented. In general, all clustering algorithms segmented the data in a very satisfactory way, highlighting the excellent performance of the hierarchical clustering algorithm ”average”method.Sousa, InêsRodrigues, LuísUniversidade do MinhoCosta, Nelson Filipe Sá2023-01-112023-01-11T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/84928por203266986info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:56:54Zoai:repositorium.sdum.uminho.pt:1822/84928Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:46:34.895002Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Análise multivariada de dados sobre tipologia de produtos numa empresa Multivariate analysis of data on typology of products in a company |
title |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
spellingShingle |
Análise multivariada de dados sobre tipologia de produtos numa empresa Costa, Nelson Filipe Sá Machine learning PCA k-Means Clustering hierárquico Vendas Hierarchical clustering Sales Ciências Naturais::Matemáticas |
title_short |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
title_full |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
title_fullStr |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
title_full_unstemmed |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
title_sort |
Análise multivariada de dados sobre tipologia de produtos numa empresa |
author |
Costa, Nelson Filipe Sá |
author_facet |
Costa, Nelson Filipe Sá |
author_role |
author |
dc.contributor.none.fl_str_mv |
Sousa, Inês Rodrigues, Luís Universidade do Minho |
dc.contributor.author.fl_str_mv |
Costa, Nelson Filipe Sá |
dc.subject.por.fl_str_mv |
Machine learning PCA k-Means Clustering hierárquico Vendas Hierarchical clustering Sales Ciências Naturais::Matemáticas |
topic |
Machine learning PCA k-Means Clustering hierárquico Vendas Hierarchical clustering Sales Ciências Naturais::Matemáticas |
description |
Dissertação de mestrado em Matemática e Computação |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-01-11 2023-01-11T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/84928 |
url |
https://hdl.handle.net/1822/84928 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
203266986 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132222058397696 |