Aplicação de técnicas de machine learning em modelos de escore de crédito

Detalhes bibliográficos
Autor(a) principal: Lukosiunas, Andreza
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do INSPER
Texto Completo: https://www.repositorio.insper.edu.br/handle/11224/2573
Resumo: Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.
id INSP_2e618b630610f8a82c83ddcdd66eddfa
oai_identifier_str oai:repositorio.insper.edu.br:11224/2573
network_acronym_str INSP
network_name_str Biblioteca Digital de Teses e Dissertações do INSPER
repository_id_str
spelling Lukosiunas, AndrezaAyres, Fábio JoséMadalozzo, ReginaAlencar, Airlane PereiraArtes, RinaldoSão Paulo, SP2021-09-13T03:20:39Z2020-07-16T18:41:25Z2021-09-13T03:20:39Z20182020-07-16T18:41:25Z20182018https://www.repositorio.insper.edu.br/handle/11224/2573Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.Aiming at increasing profit and reducing loss, creditor financial institutions strive to improve the accuracy by predicting the chances of potential borrowers becoming defaulters. With increasing computational processing capacity, machine learning techniques are becoming very popular in a variety of environments. In the face of these two scenarios, this work proposes the comparison of logistic regression, random forests, xgboost and multilayer perceptron applied to a credit score dataset provided by Serasa Experian containing the public of small and medium enterprises. Hypothesis tests were used with DeLong test to compare the areas under the roc curve of the presented models. The main contribution of this work was to show that there was superiority of the random forests technique when compared to the others presented in this work to differentiate good or bad payers.68 p.TODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessEscore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.Aplicação de técnicas de machine learning em modelos de escore de créditoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Biblioteca Digital de Teses e Dissertações do INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPERTEXTDissertacao- Andreza Lukosiunas.pdf.txtExtracted texttext/plain104060https://repositorio.insper.edu.br/bitstream/11224/2573/1/Dissertacao-%20Andreza%20Lukosiunas.pdf.txtac697e94164c7c2c2e6c295ab1fcc16dMD51LICENSElicense.txttext/plain1748https://repositorio.insper.edu.br/bitstream/11224/2573/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDissertacao- Andreza Lukosiunas.pdfapplication/pdf1105677https://repositorio.insper.edu.br/bitstream/11224/2573/3/Dissertacao-%20Andreza%20Lukosiunas.pdf824886c3b47a0ba10bcc31ba32a63a3cMD53THUMBNAILDissertacao- Andreza Lukosiunas.pdf.jpgDissertacao- Andreza Lukosiunas.pdf.jpgGenerated Thumbnailimage/jpeg1251https://repositorio.insper.edu.br/bitstream/11224/2573/4/Dissertacao-%20Andreza%20Lukosiunas.pdf.jpg49d724934caff0bc493e08b61dc4f5d3MD5411224/25732022-12-02 12:55:24.474oai:repositorio.insper.edu.br:11224/2573Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br ||opendoar:2022-12-02T17:55:24Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false
dc.title.pt_BR.fl_str_mv Aplicação de técnicas de machine learning em modelos de escore de crédito
title Aplicação de técnicas de machine learning em modelos de escore de crédito
spellingShingle Aplicação de técnicas de machine learning em modelos de escore de crédito
Lukosiunas, Andreza
Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.
title_short Aplicação de técnicas de machine learning em modelos de escore de crédito
title_full Aplicação de técnicas de machine learning em modelos de escore de crédito
title_fullStr Aplicação de técnicas de machine learning em modelos de escore de crédito
title_full_unstemmed Aplicação de técnicas de machine learning em modelos de escore de crédito
title_sort Aplicação de técnicas de machine learning em modelos de escore de crédito
author Lukosiunas, Andreza
author_facet Lukosiunas, Andreza
author_role author
dc.contributor.defensecommittee.none.fl_str_mv Ayres, Fábio José
Madalozzo, Regina
Alencar, Airlane Pereira
dc.contributor.author.fl_str_mv Lukosiunas, Andreza
dc.contributor.advisor1.fl_str_mv Artes, Rinaldo
contributor_str_mv Artes, Rinaldo
dc.subject.por.fl_str_mv Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.
topic Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.
description Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.
publishDate 2018
dc.date.submitted.none.fl_str_mv 2018
dc.date.available.fl_str_mv 2018
2020-07-16T18:41:25Z
2021-09-13T03:20:39Z
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2020-07-16T18:41:25Z
2021-09-13T03:20:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.repositorio.insper.edu.br/handle/11224/2573
url https://www.repositorio.insper.edu.br/handle/11224/2573
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 68 p.
dc.coverage.spatial.pt_BR.fl_str_mv São Paulo, SP
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do INSPER
instname:Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron:INSPER
instname_str Instituição de Ensino Superior e de Pesquisa (INSPER)
instacron_str INSPER
institution INSPER
reponame_str Biblioteca Digital de Teses e Dissertações do INSPER
collection Biblioteca Digital de Teses e Dissertações do INSPER
bitstream.url.fl_str_mv https://repositorio.insper.edu.br/bitstream/11224/2573/1/Dissertacao-%20Andreza%20Lukosiunas.pdf.txt
https://repositorio.insper.edu.br/bitstream/11224/2573/2/license.txt
https://repositorio.insper.edu.br/bitstream/11224/2573/3/Dissertacao-%20Andreza%20Lukosiunas.pdf
https://repositorio.insper.edu.br/bitstream/11224/2573/4/Dissertacao-%20Andreza%20Lukosiunas.pdf.jpg
bitstream.checksum.fl_str_mv ac697e94164c7c2c2e6c295ab1fcc16d
8a4605be74aa9ea9d79846c1fba20a33
824886c3b47a0ba10bcc31ba32a63a3c
49d724934caff0bc493e08b61dc4f5d3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)
repository.mail.fl_str_mv biblioteca@insper.edu.br ||
_version_ 1791085959836598272