Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes

Detalhes bibliográficos
Autor(a) principal: Silva, Fernanda Trentino
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UFMT
Texto Completo: http://bdm.ufmt.br/handle/1/1969
Resumo: The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.
id UFMT-1_4ee4672502cbc4aa3037971513be1ec8
oai_identifier_str oai:localhost:1/1969
network_acronym_str UFMT-1
network_name_str Biblioteca Digital de Monografias da UFMT
repository_id_str
spelling Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentesCNPQ::ENGENHARIASFloresta aleatóriaÁrvores de decisãoClassificação de atrasosRandom forestDecision treesClassification of delaysThe high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.O alto índice de inadimplência leva empresas a procurarem alternativas para estimar atrasos em seus recebimentos. A inadimplência pode ser a grande responsável por transtornos e mau rendimento financeiro de uma empresa, por isso deve ser controlada e detida antes de causar maiores problemas ao fluxo de caixa. Isso provocou no mercado o destaque ás vantagens em se investir na área de estudo de dados, buscando avanços tecnológicos que tornem possíveis a construção de modelos de dados capazes de identificar o perfil de clientes inadimplentes e orientar melhor os processos. O objetivo desse trabalho foi desenvolver um modelo de classificação utilizando uma floresta aleatória que permite reconhecer o perfil de clientes adimplentes ou inadimplentes. A hipótese de pesquisa é que uma vasta gama de oportunidades se abrem ao aplicar os resultados gerados pelo modelo para aperfeiçoar o pré-venda, alinhar a gestão de cobrança e ajustar o fluxo de caixa contando com a falta da receita inadimplente. Os resultados com a implementação da metodologia de análise temporal, obtidos e analisados através das métricas de acurácia, da precisão e da revocação foram satisfatórios. Atingindo uma taxa de 95% para a acurácia, 90% de precisão e 0.76% de revocação. O modelo deve continuar ser manuseado e melhorado sua capacidade decisiva, além de possuir oportunidades de discussão em relação a adequações que podem garantir ao modelo uma decisão mais precisa.Universidade Federal de Mato GrossoBrasilInstituto de Engenharia – Várzea GrandeUFMT CUVG - Várzea GrandeEngenharia de Computação - CUVGTeixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Teixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Bezerra, Diogo Henrique Duartehttp://lattes.cnpq.br/7941421723739379Marins, Joyce Aline de Oliveirahttp://lattes.cnpq.br/6660281860065004Silva, Fernanda Trentino2021-10-27T16:46:54Z2021-05-312021-10-27T16:46:54Z2021-05-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/datasetSILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.http://bdm.ufmt.br/handle/1/1969porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Monografias da UFMTinstname:Universidade Federal de Mato Grosso (UFMT)instacron:UFMT2021-10-30T07:00:37Zoai:localhost:1/1969Biblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestopendoar:2021-10-30T07:00:37falseBiblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestbibliotecacentral@ufmt.br||opendoar:2021-10-30T07:00:37Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT)false
dc.title.none.fl_str_mv Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
spellingShingle Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
Silva, Fernanda Trentino
CNPQ::ENGENHARIAS
Floresta aleatória
Árvores de decisão
Classificação de atrasos
Random forest
Decision trees
Classification of delays
title_short Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_full Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_fullStr Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_full_unstemmed Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_sort Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
author Silva, Fernanda Trentino
author_facet Silva, Fernanda Trentino
author_role author
dc.contributor.none.fl_str_mv Teixeira, Raoni Florentino da Silva
http://lattes.cnpq.br/5079017129840047
Teixeira, Raoni Florentino da Silva
http://lattes.cnpq.br/5079017129840047
Bezerra, Diogo Henrique Duarte
http://lattes.cnpq.br/7941421723739379
Marins, Joyce Aline de Oliveira
http://lattes.cnpq.br/6660281860065004
dc.contributor.author.fl_str_mv Silva, Fernanda Trentino
dc.subject.por.fl_str_mv CNPQ::ENGENHARIAS
Floresta aleatória
Árvores de decisão
Classificação de atrasos
Random forest
Decision trees
Classification of delays
topic CNPQ::ENGENHARIAS
Floresta aleatória
Árvores de decisão
Classificação de atrasos
Random forest
Decision trees
Classification of delays
description The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.
publishDate 2021
dc.date.none.fl_str_mv 2021-10-27T16:46:54Z
2021-05-31
2021-10-27T16:46:54Z
2021-05-28
dc.type.driver.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/dataset
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.
http://bdm.ufmt.br/handle/1/1969
identifier_str_mv SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.
url http://bdm.ufmt.br/handle/1/1969
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Mato Grosso
Brasil
Instituto de Engenharia – Várzea Grande
UFMT CUVG - Várzea Grande
Engenharia de Computação - CUVG
publisher.none.fl_str_mv Universidade Federal de Mato Grosso
Brasil
Instituto de Engenharia – Várzea Grande
UFMT CUVG - Várzea Grande
Engenharia de Computação - CUVG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UFMT
instname:Universidade Federal de Mato Grosso (UFMT)
instacron:UFMT
instname_str Universidade Federal de Mato Grosso (UFMT)
instacron_str UFMT
institution UFMT
reponame_str Biblioteca Digital de Monografias da UFMT
collection Biblioteca Digital de Monografias da UFMT
repository.name.fl_str_mv Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT)
repository.mail.fl_str_mv bibliotecacentral@ufmt.br||
_version_ 1804658250938843136