Modelos Preditivos de Abandono do Consumo

Detalhes bibliográficos
Autor(a) principal: Machado, Sara Alexandre Silva Machado
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/152443
Resumo: A facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica.
id RCAP_0aebeccb4983cd572061288602e8c1b5
oai_identifier_str oai:run.unl.pt:10362/152443
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Modelos Preditivos de Abandono do ConsumoAbandonoClienteChurnConsumoFeature SelectionMachine LearningDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica.With the increase in confidence in online stores and due to its ease of use, customer retention has never been a topic as addressed as it is today. More and more companies look for new solutions to identify customers before they completely abandon their physical stores. In this dissertation, we are proposing a way not only to classify customers but also to model their behavior, with respect to customer abandonment. To achieve these results, the first step was to define the target and then, using Machine Learning algorithms, formulate a model capable of modeling customer behavior. To achieve this goal, it was necessary to pre process the data where new variables were created and outliers were removed. In addition to our main objective, we will also explore which variables are decisive for modeling the evasive behavior of customers using the recursive feature selection method, as well as comparing different Machine Learning algorithms. A small study was also carried out regarding class imbalance, verifying whether the SMOTE technique represents a solution to such a problem. With this information duly anticipated, companies will have the ability to model the behavior of their customers, thus being able to create preventive measures to prevent abandonment of consumption. The results show a clear superiority in the performance of the Random Forest algo- rithm compared to the others. Regarding the most influential variables, we conclude that the descriptive variables of the operator who attended the customer more often, proved to be more important than the others. The SMOTE technique, on the other hand, did not show the intended performances, having not obtained superior results to the models without using the technique.Bispo, ReginaRUNMachado, Sara Alexandre Silva Machado2023-05-05T10:34:48Z2021-022021-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/152443porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:34:47Zoai:run.unl.pt:10362/152443Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:54:55.090296Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Modelos Preditivos de Abandono do Consumo
title Modelos Preditivos de Abandono do Consumo
spellingShingle Modelos Preditivos de Abandono do Consumo
Machado, Sara Alexandre Silva Machado
Abandono
Cliente
Churn
Consumo
Feature Selection
Machine Learning
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Modelos Preditivos de Abandono do Consumo
title_full Modelos Preditivos de Abandono do Consumo
title_fullStr Modelos Preditivos de Abandono do Consumo
title_full_unstemmed Modelos Preditivos de Abandono do Consumo
title_sort Modelos Preditivos de Abandono do Consumo
author Machado, Sara Alexandre Silva Machado
author_facet Machado, Sara Alexandre Silva Machado
author_role author
dc.contributor.none.fl_str_mv Bispo, Regina
RUN
dc.contributor.author.fl_str_mv Machado, Sara Alexandre Silva Machado
dc.subject.por.fl_str_mv Abandono
Cliente
Churn
Consumo
Feature Selection
Machine Learning
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Abandono
Cliente
Churn
Consumo
Feature Selection
Machine Learning
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description A facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica.
publishDate 2021
dc.date.none.fl_str_mv 2021-02
2021-02-01T00:00:00Z
2023-05-05T10:34:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/152443
url http://hdl.handle.net/10362/152443
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138137326223360