Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes

Silva, Fernanda Trentino

Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes

Detalhes bibliográficos
Autor(a) principal:	Silva, Fernanda Trentino
Data de Publicação:	2021
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Biblioteca Digital de Monografias da UFMT
Texto Completo:	http://bdm.ufmt.br/handle/1/1969
Resumo:	The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.

Metadados do item

id	UFMT-1_4ee4672502cbc4aa3037971513be1ec8
oai_identifier_str	oai:localhost:1/1969
network_acronym_str	UFMT-1
network_name_str	Biblioteca Digital de Monografias da UFMT
repository_id_str
spelling	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentesCNPQ::ENGENHARIASFloresta aleatóriaÁrvores de decisãoClassificação de atrasosRandom forestDecision treesClassification of delaysThe high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.O alto índice de inadimplência leva empresas a procurarem alternativas para estimar atrasos em seus recebimentos. A inadimplência pode ser a grande responsável por transtornos e mau rendimento financeiro de uma empresa, por isso deve ser controlada e detida antes de causar maiores problemas ao fluxo de caixa. Isso provocou no mercado o destaque ás vantagens em se investir na área de estudo de dados, buscando avanços tecnológicos que tornem possíveis a construção de modelos de dados capazes de identificar o perfil de clientes inadimplentes e orientar melhor os processos. O objetivo desse trabalho foi desenvolver um modelo de classificação utilizando uma floresta aleatória que permite reconhecer o perfil de clientes adimplentes ou inadimplentes. A hipótese de pesquisa é que uma vasta gama de oportunidades se abrem ao aplicar os resultados gerados pelo modelo para aperfeiçoar o pré-venda, alinhar a gestão de cobrança e ajustar o fluxo de caixa contando com a falta da receita inadimplente. Os resultados com a implementação da metodologia de análise temporal, obtidos e analisados através das métricas de acurácia, da precisão e da revocação foram satisfatórios. Atingindo uma taxa de 95% para a acurácia, 90% de precisão e 0.76% de revocação. O modelo deve continuar ser manuseado e melhorado sua capacidade decisiva, além de possuir oportunidades de discussão em relação a adequações que podem garantir ao modelo uma decisão mais precisa.Universidade Federal de Mato GrossoBrasilInstituto de Engenharia – Várzea GrandeUFMT CUVG - Várzea GrandeEngenharia de Computação - CUVGTeixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Teixeira, Raoni Florentino da Silvahttp://lattes.cnpq.br/5079017129840047Bezerra, Diogo Henrique Duartehttp://lattes.cnpq.br/7941421723739379Marins, Joyce Aline de Oliveirahttp://lattes.cnpq.br/6660281860065004Silva, Fernanda Trentino2021-10-27T16:46:54Z2021-05-312021-10-27T16:46:54Z2021-05-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/datasetSILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.http://bdm.ufmt.br/handle/1/1969porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Monografias da UFMTinstname:Universidade Federal de Mato Grosso (UFMT)instacron:UFMT2021-10-30T07:00:37Zoai:localhost:1/1969Biblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestopendoar:2021-10-30T07:00:37falseBiblioteca Digital de Monografiahttps://bdm.ufmt.br/PUBhttp://200.129.241.122/oai/requestbibliotecacentral@ufmt.br\|\|opendoar:2021-10-30T07:00:37Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT)false
dc.title.none.fl_str_mv	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
spellingShingle	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes Silva, Fernanda Trentino CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays
title_short	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_full	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_fullStr	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_full_unstemmed	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
title_sort	Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes
author	Silva, Fernanda Trentino
author_facet	Silva, Fernanda Trentino
author_role	author
dc.contributor.none.fl_str_mv	Teixeira, Raoni Florentino da Silva http://lattes.cnpq.br/5079017129840047 Teixeira, Raoni Florentino da Silva http://lattes.cnpq.br/5079017129840047 Bezerra, Diogo Henrique Duarte http://lattes.cnpq.br/7941421723739379 Marins, Joyce Aline de Oliveira http://lattes.cnpq.br/6660281860065004
dc.contributor.author.fl_str_mv	Silva, Fernanda Trentino
dc.subject.por.fl_str_mv	CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays
topic	CNPQ::ENGENHARIAS Floresta aleatória Árvores de decisão Classificação de atrasos Random forest Decision trees Classification of delays
description	The high default rate leads companies to look for alternatives to estimate delays in their receipts. Default can be largely responsible for a company’s disruption and poor fi-nancial performance. Due its importance, some companies are now investing in the data analysis area, seeking technological advances that make it possible to build data models that can identify the profile of their customers. The objective of this work was to develop a classification model using a random forest to recognize the profile of defaulting or defaulting customers. The research hypothesis is that new opportunities open up when applying the results generated by the model to improve pre-sales, align collection management and adjust cash flow with thelack of defaulting revenue. The proposed model was evaluaeted by using accuracy, precision and recall. In the experiments, we achieve a rate of 95 % for accuracy, 90 % for precision and 0.76 % for recall. The results were promising but additional experiments and evaluations must be carried out before putting the model into production.
publishDate	2021
dc.date.none.fl_str_mv	2021-10-27T16:46:54Z 2021-05-31 2021-10-27T16:46:54Z 2021-05-28
dc.type.driver.fl_str_mv	info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/dataset
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021. http://bdm.ufmt.br/handle/1/1969
identifier_str_mv	SILVA, Fernanda Trentino. Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes. 2021. 48 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Faculdade de Engenharia, Universidade Federal de Mato Grosso – Campus Universitário de Várzea Grande, Cuiabá, 2021.
url	http://bdm.ufmt.br/handle/1/1969
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Mato Grosso Brasil Instituto de Engenharia – Várzea Grande UFMT CUVG - Várzea Grande Engenharia de Computação - CUVG
publisher.none.fl_str_mv	Universidade Federal de Mato Grosso Brasil Instituto de Engenharia – Várzea Grande UFMT CUVG - Várzea Grande Engenharia de Computação - CUVG
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Monografias da UFMT instname:Universidade Federal de Mato Grosso (UFMT) instacron:UFMT
instname_str	Universidade Federal de Mato Grosso (UFMT)
instacron_str	UFMT
institution	UFMT
reponame_str	Biblioteca Digital de Monografias da UFMT
collection	Biblioteca Digital de Monografias da UFMT
repository.name.fl_str_mv	Biblioteca Digital de Monografias da UFMT - Universidade Federal de Mato Grosso (UFMT)
repository.mail.fl_str_mv	bibliotecacentral@ufmt.br\|\|
_version_	1804658250938843136

Aplicação do algoritmo ensemble de floresta aleatória para a classificação de clientes adimplentes e inadimplentes

Registros relacionados