Análise multivariada de dados sobre tipologia de produtos numa empresa

Detalhes bibliográficos
Autor(a) principal: Costa, Nelson Filipe Sá
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/84928
Resumo: Dissertação de mestrado em Matemática e Computação
id RCAP_058d2b2c6fd0626aeddc6a1f28cd9fe1
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/84928
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise multivariada de dados sobre tipologia de produtos numa empresaMultivariate analysis of data on typology of products in a companyMachine learningPCAk-MeansClustering hierárquicoVendasHierarchical clusteringSalesCiências Naturais::MatemáticasDissertação de mestrado em Matemática e ComputaçãoAs pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior lucro. O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos de k-Means e clustering hierárquico. O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados, nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do algoritmo clustering hierárquico método ”average”.Small, medium and large companies collect their data hoping that it will somehow generate commer cial value. Machine learning has the ability to provide valuable information from data, serving as the main sales strategy for the company to achieve greater profit. The objective of this dissertation is to analyze sales data from the company Litel, Lda, seeking to extract sales patterns related to products (boxes and bags) that share similarities with each other. In order to achieve this objective, unsupervised learning methodologies are presented, which allow for a segmentation of groups, namely Principal Component Analysis (PCA), k-Means algorithms and hierarchical clustering. The PCA was used to identify correlated variables and identify hidden patterns in the data, namely product families with similar sales. The elbow, silhouette and 30 indices methods were applied to choose the best number of clusters, in order to identify the optimal number of clusters. Validation methods were also applied in order to identify the clustering algorithm with the best performance. Through the stability measures, the consistency of the clusters was evaluated, and through the cophenetic coefficient, the combination of methods that reflected a better data grouping was determined. After carrying out the previous validations, the respective clustering algorithms were implemented. In general, all clustering algorithms segmented the data in a very satisfactory way, highlighting the excellent performance of the hierarchical clustering algorithm ”average”method.Sousa, InêsRodrigues, LuísUniversidade do MinhoCosta, Nelson Filipe Sá2023-01-112023-01-11T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/84928por203266986info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T11:56:54Zoai:repositorium.sdum.uminho.pt:1822/84928Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T18:46:34.895002Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise multivariada de dados sobre tipologia de produtos numa empresa
Multivariate analysis of data on typology of products in a company
title Análise multivariada de dados sobre tipologia de produtos numa empresa
spellingShingle Análise multivariada de dados sobre tipologia de produtos numa empresa
Costa, Nelson Filipe Sá
Machine learning
PCA
k-Means
Clustering hierárquico
Vendas
Hierarchical clustering
Sales
Ciências Naturais::Matemáticas
title_short Análise multivariada de dados sobre tipologia de produtos numa empresa
title_full Análise multivariada de dados sobre tipologia de produtos numa empresa
title_fullStr Análise multivariada de dados sobre tipologia de produtos numa empresa
title_full_unstemmed Análise multivariada de dados sobre tipologia de produtos numa empresa
title_sort Análise multivariada de dados sobre tipologia de produtos numa empresa
author Costa, Nelson Filipe Sá
author_facet Costa, Nelson Filipe Sá
author_role author
dc.contributor.none.fl_str_mv Sousa, Inês
Rodrigues, Luís
Universidade do Minho
dc.contributor.author.fl_str_mv Costa, Nelson Filipe Sá
dc.subject.por.fl_str_mv Machine learning
PCA
k-Means
Clustering hierárquico
Vendas
Hierarchical clustering
Sales
Ciências Naturais::Matemáticas
topic Machine learning
PCA
k-Means
Clustering hierárquico
Vendas
Hierarchical clustering
Sales
Ciências Naturais::Matemáticas
description Dissertação de mestrado em Matemática e Computação
publishDate 2023
dc.date.none.fl_str_mv 2023-01-11
2023-01-11T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/84928
url https://hdl.handle.net/1822/84928
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203266986
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132222058397696