Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito

Detalhes bibliográficos
Autor(a) principal: Silverio, Murilo
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do INSPER
Texto Completo: https://www.repositorio.insper.edu.br/handle/11224/1503
Resumo: RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees.
id INSP_a7fc73205d6914fb0feb9581c5278c15
oai_identifier_str oai:repositorio.insper.edu.br:11224/1503
network_acronym_str INSP
network_name_str Biblioteca Digital de Teses e Dissertações do INSPER
repository_id_str
spelling Silverio, MuriloMinardi, Andrea Maria Accioly FonsecaCardoso Jr, Nilton Deodoro MoreiraArtes, RinaldoSão Paulo2021-09-13T03:17:22Z2016-09-17T15:13:22Z2021-09-13T03:17:22Z20152016-09-17T15:13:22Z20152015https://www.repositorio.insper.edu.br/handle/11224/1503RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees.Credit scoring models have become an important tool for financial institutions due to the need for standardization and agility in credit analysis. According to Thomas (2009) logistic regression has been the most used technique in the construction of these models. However, in the last fifteen years, models based on machine learning algorithms have emerged and presented superior results to logistic regression models, as can be seen in Kruppa et al. (2013) and Lessmann et al. (2015). This paper proposes a comparison between logistic regression models and models created using the machine learning techniques Random Forests and Logistic Model Trees. To develop the model a database provided by a financial institution, related to a retail credit operation was used. The Kolmogorov-Smirnov statistic and the Gini coefficient determined the performance of each model. As the main result, this work confirms the superiority of Random Forests model against the logistic regression model, but the same result is not reached with the model of Logistic Model Trees.61 p.TODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessEscore de créditoAprendizado de máquinaRegressão LogísticaRandom ForestsLogistic Model TreesCredit scoreMachine LearningLogistic RegressionAplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de créditoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPERTEXTMurilo Silverio_Trabalho.pdf.txtExtracted texttext/plain100157https://repositorio.insper.edu.br/bitstream/11224/1503/1/Murilo%20Silverio_Trabalho.pdf.txt43ac9fb9170148d577c47e6f5a0d0e29MD51LICENSElicense.txttext/plain1748https://repositorio.insper.edu.br/bitstream/11224/1503/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALMurilo Silverio_Trabalho.pdfTEXTO COMPLETOapplication/pdf912828https://repositorio.insper.edu.br/bitstream/11224/1503/3/Murilo%20Silverio_Trabalho.pdf8a127f13e191f33e3213ea594fc0e944MD53THUMBNAILMurilo Silverio_Trabalho.pdf.jpgMurilo Silverio_Trabalho.pdf.jpgGenerated Thumbnailimage/jpeg1147https://repositorio.insper.edu.br/bitstream/11224/1503/4/Murilo%20Silverio_Trabalho.pdf.jpgf2557e9d0439492f2697ea7f75bca37dMD5411224/15032022-12-02 12:52:47.121oai:repositorio.insper.edu.br:11224/1503Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2022-12-02T17:52:47Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false
dc.title.pt_BR.fl_str_mv Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
title Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
spellingShingle Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
Silverio, Murilo
Escore de crédito
Aprendizado de máquina
Regressão Logística
Random Forests
Logistic Model Trees
Credit score
Machine Learning
Logistic Regression
title_short Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
title_full Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
title_fullStr Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
title_full_unstemmed Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
title_sort Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
author Silverio, Murilo
author_facet Silverio, Murilo
author_role author
dc.contributor.defensecommittee.none.fl_str_mv Minardi, Andrea Maria Accioly Fonseca
Cardoso Jr, Nilton Deodoro Moreira
dc.contributor.author.fl_str_mv Silverio, Murilo
dc.contributor.advisor1.fl_str_mv Artes, Rinaldo
contributor_str_mv Artes, Rinaldo
dc.subject.por.fl_str_mv Escore de crédito
Aprendizado de máquina
Regressão Logística
Random Forests
Logistic Model Trees
Credit score
Machine Learning
Logistic Regression
topic Escore de crédito
Aprendizado de máquina
Regressão Logística
Random Forests
Logistic Model Trees
Credit score
Machine Learning
Logistic Regression
description RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015
dc.date.available.fl_str_mv 2015
2016-09-17T15:13:22Z
2021-09-13T03:17:22Z
dc.date.issued.fl_str_mv 2015
dc.date.accessioned.fl_str_mv 2016-09-17T15:13:22Z
2021-09-13T03:17:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.repositorio.insper.edu.br/handle/11224/1503
url https://www.repositorio.insper.edu.br/handle/11224/1503
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 61 p.
dc.coverage.spatial.pt_BR.fl_str_mv São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do INSPER
instname:Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron:INSPER
instname_str Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron_str INSPER
institution INSPER
reponame_str Biblioteca Digital de Teses e Dissertações do INSPER
collection Biblioteca Digital de Teses e Dissertações do INSPER
bitstream.url.fl_str_mv https://repositorio.insper.edu.br/bitstream/11224/1503/1/Murilo%20Silverio_Trabalho.pdf.txt
https://repositorio.insper.edu.br/bitstream/11224/1503/2/license.txt
https://repositorio.insper.edu.br/bitstream/11224/1503/3/Murilo%20Silverio_Trabalho.pdf
https://repositorio.insper.edu.br/bitstream/11224/1503/4/Murilo%20Silverio_Trabalho.pdf.jpg
bitstream.checksum.fl_str_mv 43ac9fb9170148d577c47e6f5a0d0e29
8a4605be74aa9ea9d79846c1fba20a33
8a127f13e191f33e3213ea594fc0e944
f2557e9d0439492f2697ea7f75bca37d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)
repository.mail.fl_str_mv biblioteca@insper.edu.br ||
_version_ 1791085954738421760