Aplicação de técnicas de machine learning em modelos de escore de crédito
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações do INSPER |
Texto Completo: | https://www.repositorio.insper.edu.br/handle/11224/2573 |
Resumo: | Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores. |
id |
INSP_2e618b630610f8a82c83ddcdd66eddfa |
---|---|
oai_identifier_str |
oai:repositorio.insper.edu.br:11224/2573 |
network_acronym_str |
INSP |
network_name_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
repository_id_str |
|
spelling |
Lukosiunas, AndrezaAyres, Fábio JoséMadalozzo, ReginaAlencar, Airlane PereiraArtes, RinaldoSão Paulo, SP2021-09-13T03:20:39Z2020-07-16T18:41:25Z2021-09-13T03:20:39Z20182020-07-16T18:41:25Z20182018https://www.repositorio.insper.edu.br/handle/11224/2573Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.Aiming at increasing profit and reducing loss, creditor financial institutions strive to improve the accuracy by predicting the chances of potential borrowers becoming defaulters. With increasing computational processing capacity, machine learning techniques are becoming very popular in a variety of environments. In the face of these two scenarios, this work proposes the comparison of logistic regression, random forests, xgboost and multilayer perceptron applied to a credit score dataset provided by Serasa Experian containing the public of small and medium enterprises. Hypothesis tests were used with DeLong test to compare the areas under the roc curve of the presented models. The main contribution of this work was to show that there was superiority of the random forests technique when compared to the others presented in this work to differentiate good or bad payers.68 p.TODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessEscore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.Aplicação de técnicas de machine learning em modelos de escore de créditoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPERTEXTDissertacao- Andreza Lukosiunas.pdf.txtExtracted texttext/plain104060https://repositorio.insper.edu.br/bitstream/11224/2573/1/Dissertacao-%20Andreza%20Lukosiunas.pdf.txtac697e94164c7c2c2e6c295ab1fcc16dMD51LICENSElicense.txttext/plain1748https://repositorio.insper.edu.br/bitstream/11224/2573/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertacao- Andreza Lukosiunas.pdfapplication/pdf1105677https://repositorio.insper.edu.br/bitstream/11224/2573/3/Dissertacao-%20Andreza%20Lukosiunas.pdf824886c3b47a0ba10bcc31ba32a63a3cMD53THUMBNAILDissertacao- Andreza Lukosiunas.pdf.jpgDissertacao- Andreza Lukosiunas.pdf.jpgGenerated Thumbnailimage/jpeg1251https://repositorio.insper.edu.br/bitstream/11224/2573/4/Dissertacao-%20Andreza%20Lukosiunas.pdf.jpg49d724934caff0bc493e08b61dc4f5d3MD5411224/25732022-12-02 12:55:24.474oai:repositorio.insper.edu.br:11224/2573Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2022-12-02T17:55:24Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false |
dc.title.pt_BR.fl_str_mv |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
title |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
spellingShingle |
Aplicação de técnicas de machine learning em modelos de escore de crédito Lukosiunas, Andreza Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia. |
title_short |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
title_full |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
title_fullStr |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
title_full_unstemmed |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
title_sort |
Aplicação de técnicas de machine learning em modelos de escore de crédito |
author |
Lukosiunas, Andreza |
author_facet |
Lukosiunas, Andreza |
author_role |
author |
dc.contributor.defensecommittee.none.fl_str_mv |
Ayres, Fábio José Madalozzo, Regina Alencar, Airlane Pereira |
dc.contributor.author.fl_str_mv |
Lukosiunas, Andreza |
dc.contributor.advisor1.fl_str_mv |
Artes, Rinaldo |
contributor_str_mv |
Artes, Rinaldo |
dc.subject.por.fl_str_mv |
Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia. |
topic |
Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia. |
description |
Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores. |
publishDate |
2018 |
dc.date.submitted.none.fl_str_mv |
2018 |
dc.date.available.fl_str_mv |
2018 2020-07-16T18:41:25Z 2021-09-13T03:20:39Z |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2020-07-16T18:41:25Z 2021-09-13T03:20:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.repositorio.insper.edu.br/handle/11224/2573 |
url |
https://www.repositorio.insper.edu.br/handle/11224/2573 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
68 p. |
dc.coverage.spatial.pt_BR.fl_str_mv |
São Paulo, SP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do INSPER instname:Instituição de Ensino Superior e de Pesquisa (INSPER) instacron:INSPER |
instname_str |
Instituição de Ensino Superior e de Pesquisa (INSPER) |
instacron_str |
INSPER |
institution |
INSPER |
reponame_str |
Biblioteca Digital de Teses e Dissertações do INSPER |
collection |
Biblioteca Digital de Teses e Dissertações do INSPER |
bitstream.url.fl_str_mv |
https://repositorio.insper.edu.br/bitstream/11224/2573/1/Dissertacao-%20Andreza%20Lukosiunas.pdf.txt https://repositorio.insper.edu.br/bitstream/11224/2573/2/license.txt https://repositorio.insper.edu.br/bitstream/11224/2573/3/Dissertacao-%20Andreza%20Lukosiunas.pdf https://repositorio.insper.edu.br/bitstream/11224/2573/4/Dissertacao-%20Andreza%20Lukosiunas.pdf.jpg |
bitstream.checksum.fl_str_mv |
ac697e94164c7c2c2e6c295ab1fcc16d 8a4605be74aa9ea9d79846c1fba20a33 824886c3b47a0ba10bcc31ba32a63a3c 49d724934caff0bc493e08b61dc4f5d3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER) |
repository.mail.fl_str_mv |
biblioteca@insper.edu.br || |
_version_ |
1791085959836598272 |