Modelos Preditivos de Abandono do Consumo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/152443 |
Resumo: | A facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica. |
id |
RCAP_0aebeccb4983cd572061288602e8c1b5 |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/152443 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Modelos Preditivos de Abandono do ConsumoAbandonoClienteChurnConsumoFeature SelectionMachine LearningDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica.With the increase in confidence in online stores and due to its ease of use, customer retention has never been a topic as addressed as it is today. More and more companies look for new solutions to identify customers before they completely abandon their physical stores. In this dissertation, we are proposing a way not only to classify customers but also to model their behavior, with respect to customer abandonment. To achieve these results, the first step was to define the target and then, using Machine Learning algorithms, formulate a model capable of modeling customer behavior. To achieve this goal, it was necessary to pre process the data where new variables were created and outliers were removed. In addition to our main objective, we will also explore which variables are decisive for modeling the evasive behavior of customers using the recursive feature selection method, as well as comparing different Machine Learning algorithms. A small study was also carried out regarding class imbalance, verifying whether the SMOTE technique represents a solution to such a problem. With this information duly anticipated, companies will have the ability to model the behavior of their customers, thus being able to create preventive measures to prevent abandonment of consumption. The results show a clear superiority in the performance of the Random Forest algo- rithm compared to the others. Regarding the most influential variables, we conclude that the descriptive variables of the operator who attended the customer more often, proved to be more important than the others. The SMOTE technique, on the other hand, did not show the intended performances, having not obtained superior results to the models without using the technique.Bispo, ReginaRUNMachado, Sara Alexandre Silva Machado2023-05-05T10:34:48Z2021-022021-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/152443porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:34:47Zoai:run.unl.pt:10362/152443Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:54:55.090296Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Modelos Preditivos de Abandono do Consumo |
title |
Modelos Preditivos de Abandono do Consumo |
spellingShingle |
Modelos Preditivos de Abandono do Consumo Machado, Sara Alexandre Silva Machado Abandono Cliente Churn Consumo Feature Selection Machine Learning Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Modelos Preditivos de Abandono do Consumo |
title_full |
Modelos Preditivos de Abandono do Consumo |
title_fullStr |
Modelos Preditivos de Abandono do Consumo |
title_full_unstemmed |
Modelos Preditivos de Abandono do Consumo |
title_sort |
Modelos Preditivos de Abandono do Consumo |
author |
Machado, Sara Alexandre Silva Machado |
author_facet |
Machado, Sara Alexandre Silva Machado |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bispo, Regina RUN |
dc.contributor.author.fl_str_mv |
Machado, Sara Alexandre Silva Machado |
dc.subject.por.fl_str_mv |
Abandono Cliente Churn Consumo Feature Selection Machine Learning Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Abandono Cliente Churn Consumo Feature Selection Machine Learning Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
A facilidade de acesso e o aumento da confiança no consumo em lojas online fazem com que a retenção de cliente em lojas físicas nunca tenha sido um tema tão abordado como é hoje em dia. Cada vez mais as empresas procuram novas soluções para identificar clientes, antes de eles abandonarem completamente as suas lojas físicas. Nesta dissertação pretende-se propor uma forma de classificar os clientes e de modelar o seu comportamento, em respeito ao abandono do consumo. Para alcançar este objetivo, o primeiro passo foi definir o target e, depois, usando algoritmos de Machine Learning, formular um modelo capaz de modelar o comportamento dos clientes. Para analisar os dados foi necessário realizar um pré-processamento, onde foram criadas variáveis e foram removidos outliers. Para além do nosso objectivo principal, iremos também explorar que variáveis são determinantes para a modelação do comportamento evasivo dos clientes recorrendo ao método recursive feature selection, assim como comparar diferentes algoritmos de Machine Learning. Foi também necessário lidar com o desequilíbrio de classes, tendo sido usada a técnica SMOTE. Com tal informação devidamente antecipada as empresas irão ter a capacidade de modelar o comportamento dos seus clientes, podendo assim criar medidas preventivas para impedir o abandono do consumo. Os resultados mostram uma clara superioridade no desempenho do algoritmo Random Forest comparativamente aos restantes. Em relação às variáveis mais influentes concluí- mos que as variáveis descritivas do operador que atendeu mais vezes o cliente, mostraram- se mais importantes que as restantes. Já a técnica SMOTE não mostrou os desempenhos pretendidos, não tendo obtido resultados superiores aos modelos sem o uso da técnica. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-02 2021-02-01T00:00:00Z 2023-05-05T10:34:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/152443 |
url |
http://hdl.handle.net/10362/152443 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799138137326223360 |