Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Monografias da UFMT |
Texto Completo: | http://bdm.ufmt.br/handle/1/1969 |
Resumo: | The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production. |
id |
UFMT-1_4ee4672502cbc4aa3037971513be1ec8 |
---|---|
oai_identifier_str |
oai:localhost:1/1969 |
network_acronym_str |
UFMT-1 |
network_name_str |
Biblioteca Digital de Monografias da UFMT |
repository_id_str |
|
spelling |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentesCNPQ::ENGENHARIASFloresta aleatóriaÁrvores de decisãoClassificação de atrasosRandom forestDecision treesClassification of delaysThe high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.O alto índice de inadimplência leva empresas a procurarem alternativas para estimar atrasos em seus recebimentos. A inadimplência pode ser a grande responsável por transtornos e mau rendimento financeiro de uma empresa, por isso deve ser controlada e detida antes de causar maiores problemas ao fluxo de caixa. Isso provocou no mercado o destaque ás vantagens em se investir na área de estudo de dados, buscando avanços tecnológicos que tornem possíveis a construção de modelos de dados capazes de identificar o perfil de clientes inadimplentes e orientar melhor os processos. O objetivo desse trabalho foi desenvolver um modelo de classificação utilizando uma floresta aleatória que permite reconhecer o perfil de clientes adimplentes ou inadimplentes. A hipótese de pesquisa é que uma vasta gama de oportunidades se abrem ao aplicar os resultados gerados pelo modelo para aperfeiçoar o pré-venda, alinhar a gestão de cobrança e ajustar o fluxo de caixa contando com a falta da receita inadimplente. Os resultados com a implementação da metodologia de análise temporal, obtidos e analisados através das métricas de acurácia, da precisão e da revocação foram satisfatórios. Atingindo uma taxa de 95% para a acurácia, 90% de precisão e 0.76% de revocação. O modelo deve continuar ser manuseado e melhorado sua capacidade decisiva, além de possuir oportunidades de discussão em relação a adequações que podem garantir ao modelo uma decisão mais precisa.Universidade Federal de Mato GrossoBrasilInstituto de Engenharia – Várzea GrandeUFMT CUVG - Várzea GrandeEngenharia de Computação - CUVGTeixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Teixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Bezerra, Diogo Henrique Duartehttp://lattes.cnpq.br/7941421723739379Marins, Joyce Aline de Oliveirahttp://lattes.cnpq.br/6660281860065004Silva, Fernanda Trentino2021-10-27T16:46:54Z2021-05-312021-10-27T16:46:54Z2021-05-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/datasetSILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.http://bdm.ufmt.br/handle/1/1969porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Monografias da UFMTinstname:Universidade Federal de Mato Grosso (UFMT)instacron:UFMT2021-10-30T07:00:37Zoai:localhost:1/1969Biblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestopendoar:2021-10-30T07:00:37falseBiblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestbibliotecacentral@ufmt.br||opendoar:2021-10-30T07:00:37Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT)false |
dc.title.none.fl_str_mv |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
title |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
spellingShingle |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes Silva, Fernanda Trentino CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays |
title_short |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
title_full |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
title_fullStr |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
title_full_unstemmed |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
title_sort |
Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes |
author |
Silva, Fernanda Trentino |
author_facet |
Silva, Fernanda Trentino |
author_role |
author |
dc.contributor.none.fl_str_mv |
Teixeira, Raoni Florentino da Silva http://lattes.cnpq.br/5079017129840047 Teixeira, Raoni Florentino da Silva http://lattes.cnpq.br/5079017129840047 Bezerra, Diogo Henrique Duarte http://lattes.cnpq.br/7941421723739379 Marins, Joyce Aline de Oliveira http://lattes.cnpq.br/6660281860065004 |
dc.contributor.author.fl_str_mv |
Silva, Fernanda Trentino |
dc.subject.por.fl_str_mv |
CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays |
topic |
CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays |
description |
The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-10-27T16:46:54Z 2021-05-31 2021-10-27T16:46:54Z 2021-05-28 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/dataset |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021. http://bdm.ufmt.br/handle/1/1969 |
identifier_str_mv |
SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021. |
url |
http://bdm.ufmt.br/handle/1/1969 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso Brasil Instituto de Engenharia – Várzea Grande UFMT CUVG - Várzea Grande Engenharia de Computação - CUVG |
publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso Brasil Instituto de Engenharia – Várzea Grande UFMT CUVG - Várzea Grande Engenharia de Computação - CUVG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UFMT instname:Universidade Federal de Mato Grosso (UFMT) instacron:UFMT |
instname_str |
Universidade Federal de Mato Grosso (UFMT) |
instacron_str |
UFMT |
institution |
UFMT |
reponame_str |
Biblioteca Digital de Monografias da UFMT |
collection |
Biblioteca Digital de Monografias da UFMT |
repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT) |
repository.mail.fl_str_mv |
bibliotecacentral@ufmt.br|| |
_version_ |
1804658250938843136 |