Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira

Detalhes bibliográficos
Autor(a) principal: Caetano, Tatiane Moreira
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/41843
Resumo: Trabalho de Conclusão de Curso (Graduação)
id UFU_99fb507f90173538ebf4963efbee4f84
oai_identifier_str oai:repositorio.ufu.br:123456789/41843
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeiraÁrvore de decisãoAprendizado de máquinaFloresta aleatóriaInadimplênciaRegressão logísticaCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICATrabalho de Conclusão de Curso (Graduação)A inadimplência é um desafio significativo para as instituições financeiras, impactando diretamente na sua saúde financeira e operacional. Identificar clientes propensos à inadimplência, com precisão e antecedência, pode contribuir para amenizar prejuízos ou para a maximização dos lucros. Os algoritmos de aprendizado supervisionado de máquina são úteis para a construção de modelos preditivos e neste caso em especial para classificação. Este estudo propõe uma análise comparativa entre três algoritmos de aprendizado de máquina para previsão de inadimplência, sendo eles a regressão logística, a árvore de decisão e a floresta aleatória aplicados aos dados originais, não normalizados e normalizados. Estas seis análises foram realizados com os dados não balanceados e balanceados pelas técnicas de SMOTE e ADASYN. O balanceamento consiste na geração de dados sintéticos na(s) classe(s) minoritárias, neste caso, na classe dos inadimplentes, para que o modelo possa ser bem treinado para realizar predições também nestas classes. Portanto, foram realizadas dezoito análises diferentes. A validação dos modelos é um ponto importante e consiste em aplicar o modelo treinado a uma parte dos dados, não utilizados no treinamento, e avaliar a sua performance por meio de alguma métrica de desempenho. Neste trabalho foram utilizadas as métricas acurácia, recall e F1-score. A metodologia, por meio da linguagem de programação Python, foi aplicada a um conjunto de dados do banco Stone composto por 7.081 clientes e 14 variáveis previsoras. Uma análise exploratória inicial foi realizada e não foram detectadas inconsistências ou dados faltantes. Identificou-se também, graficamente, que a distribuição das variáveis, em geral, são similares nas duas categorias, adimplentes e inadimplentes. Os resultados obtidos a partir da aplicação dos algoritmos, num total de dezoito análises, revelam que o melhor modelo foi obtido a partir do algoritmo floresta aleatória, nos casos com balanceamento, independente do tipo. A normalização dos dados não produziu alterações importantes nas métricas e portanto, para dados como estes considerados neste trabalho, bem como para os algoritmos utilizados, a normalização não se faz necessária. Haja vista a similaridade do algoritmo árvore de decisão com o algoritmo floresta aleatória, o primeiro pode ser indicado devido a sua simplicidade quando comparado ao segundo e, além disso, o algoritmo árvore de decisão demanda menor esforço computacional.Universidade Federal de UberlândiaBrasilEstatísticaSilva, José Waldemar dahttp://lattes.cnpq.br/3076056770753848Silva, Maria Imaculadahttp://lattes.cnpq.br/5214152217965576Miranda, Vânia de Fátimahttp://lattes.cnpq.br/8593958950706880Caetano, Tatiane Moreira2024-07-25T19:02:04Z2024-07-25T19:02:04Z2024-04-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfCAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.https://repositorio.ufu.br/handle/123456789/41843porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2024-07-26T06:18:32Zoai:repositorio.ufu.br:123456789/41843Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2024-07-26T06:18:32Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
title Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
spellingShingle Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
Caetano, Tatiane Moreira
Árvore de decisão
Aprendizado de máquina
Floresta aleatória
Inadimplência
Regressão logística
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
title_full Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
title_fullStr Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
title_full_unstemmed Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
title_sort Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira
author Caetano, Tatiane Moreira
author_facet Caetano, Tatiane Moreira
author_role author
dc.contributor.none.fl_str_mv Silva, José Waldemar da
http://lattes.cnpq.br/3076056770753848
Silva, Maria Imaculada
http://lattes.cnpq.br/5214152217965576
Miranda, Vânia de Fátima
http://lattes.cnpq.br/8593958950706880
dc.contributor.author.fl_str_mv Caetano, Tatiane Moreira
dc.subject.por.fl_str_mv Árvore de decisão
Aprendizado de máquina
Floresta aleatória
Inadimplência
Regressão logística
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
topic Árvore de decisão
Aprendizado de máquina
Floresta aleatória
Inadimplência
Regressão logística
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description Trabalho de Conclusão de Curso (Graduação)
publishDate 2024
dc.date.none.fl_str_mv 2024-07-25T19:02:04Z
2024-07-25T19:02:04Z
2024-04-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv CAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.
https://repositorio.ufu.br/handle/123456789/41843
identifier_str_mv CAETANO, Tatiane Moreira. Algoritmos de aprendizado de máquina no estudo da inadimplência em uma instituição financeira. 2024. 50 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2024.
url https://repositorio.ufu.br/handle/123456789/41843
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Estatística
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Estatística
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1813711285843394560