Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do INSPER |
Texto Completo: | https://www.repositorio.insper.edu.br/handle/11224/1503 |
Resumo: | RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees. |
id |
INSP_a7fc73205d6914fb0feb9581c5278c15 |
---|---|
oai_identifier_str |
oai:repositorio.insper.edu.br:11224/1503 |
network_acronym_str |
INSP |
network_name_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
repository_id_str |
|
spelling |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de créditoEscore de créditoAprendizado de máquinaRegressão LogísticaRandom ForestsLogistic Model TreesCredit scoreMachine LearningLogistic RegressionRESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees.Credit scoring models have become an important tool for financial institutions due to the need for standardization and agility in credit analysis. According to Thomas (2009) logistic regression has been the most used technique in the construction of these models. However, in the last fifteen years, models based on machine learning algorithms have emerged and presented superior results to logistic regression models, as can be seen in Kruppa et al. (2013) and Lessmann et al. (2015). This paper proposes a comparison between logistic regression models and models created using the machine learning techniques Random Forests and Logistic Model Trees. To develop the model a database provided by a financial institution, related to a retail credit operation was used. The Kolmogorov-Smirnov statistic and the Gini coefficient determined the performance of each model. As the main result, this work confirms the superiority of Random Forests model against the logistic regression model, but the same result is not reached with the model of Logistic Model Trees.Artes, RinaldoSilverio, MuriloSilverio, Murilo2021-09-13T03:17:22Z2016-09-17T15:13:22Z2021-09-13T03:17:22Z20152016-09-17T15:13:22Z20152015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis61 p.application/pdfhttps://www.repositorio.insper.edu.br/handle/11224/1503São PauloTODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPER2024-04-01T12:29:05Zoai:repositorio.insper.edu.br:11224/1503Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2024-04-01T12:29:05Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false |
dc.title.none.fl_str_mv |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
title |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
spellingShingle |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito Silverio, Murilo Escore de crédito Aprendizado de máquina Regressão Logística Random Forests Logistic Model Trees Credit score Machine Learning Logistic Regression |
title_short |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
title_full |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
title_fullStr |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
title_full_unstemmed |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
title_sort |
Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito |
author |
Silverio, Murilo |
author_facet |
Silverio, Murilo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Artes, Rinaldo |
dc.contributor.author.fl_str_mv |
Silverio, Murilo Silverio, Murilo |
dc.subject.por.fl_str_mv |
Escore de crédito Aprendizado de máquina Regressão Logística Random Forests Logistic Model Trees Credit score Machine Learning Logistic Regression |
topic |
Escore de crédito Aprendizado de máquina Regressão Logística Random Forests Logistic Model Trees Credit score Machine Learning Logistic Regression |
description |
RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015 2015 2015 2016-09-17T15:13:22Z 2016-09-17T15:13:22Z 2021-09-13T03:17:22Z 2021-09-13T03:17:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.repositorio.insper.edu.br/handle/11224/1503 |
url |
https://www.repositorio.insper.edu.br/handle/11224/1503 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
61 p. application/pdf |
dc.coverage.none.fl_str_mv |
São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do INSPER instname:Instituição de Ensino Superior e de Pesquisa (INSPER) instacron:INSPER |
instname_str |
Instituição de Ensino Superior e de Pesquisa (INSPER) |
instacron_str |
INSPER |
institution |
INSPER |
reponame_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
collection |
Biblioteca Digital de Teses e Dissertações do INSPER |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER) |
repository.mail.fl_str_mv |
biblioteca@insper.edu.br || |
_version_ |
1814986259992412160 |