Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/224861 |
Resumo: | Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método. |
id |
URGS_2f7c5242af429386cc7ed214fbb1cb9c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/224861 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Helder, Victor GomesFilomena, Tiago Pascoal2021-07-31T04:41:07Z2021http://hdl.handle.net/10183/224861001129311Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método.Credit scoring plays a major role for financial institutions when making credit-granting decisions. In this context, machine learning techniques have been used to develop a credit scoring model, as they seek to recognize existing patterns in databases containing the credit history of borrowers to infer potential defaulters. However, these databases often contain a large number of variables, some of which can be noisy, leading to imprecise results. In the present work, a feature selection technique is proposed based on a variable neighborhood concept, so-called VNS. The applicability of the method is assessed in conjunction with seven of the main techniques used to make default prediction in credit analysis problems. Its performance was compared to the feature selection obtained by the well-known PCA statistical method. The results indicate superior performance of the VNS in most of the applied tests, suggesting the robustness of the method.application/pdfporAdministração financeiraAnálise de créditoCredit scoringMachine learningFeature selectionVNS - Variable Neighborhood SearchComparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de AdministraçãoPrograma de Pós-Graduação em AdministraçãoPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001129311.pdf.txt001129311.pdf.txtExtracted Texttext/plain100249http://www.lume.ufrgs.br/bitstream/10183/224861/2/001129311.pdf.txt3555f90eead5bd70a96d294e01021206MD52ORIGINAL001129311.pdfTexto completoapplication/pdf554141http://www.lume.ufrgs.br/bitstream/10183/224861/1/001129311.pdf1c7b4861ef444e612839d228aacdfa31MD5110183/2248612021-08-18 04:37:55.196139oai:www.lume.ufrgs.br:10183/224861Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:37:55Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
title |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
spellingShingle |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis Helder, Victor Gomes Administração financeira Análise de crédito Credit scoring Machine learning Feature selection VNS - Variable Neighborhood Search |
title_short |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
title_full |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
title_fullStr |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
title_full_unstemmed |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
title_sort |
Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis |
author |
Helder, Victor Gomes |
author_facet |
Helder, Victor Gomes |
author_role |
author |
dc.contributor.author.fl_str_mv |
Helder, Victor Gomes |
dc.contributor.advisor1.fl_str_mv |
Filomena, Tiago Pascoal |
contributor_str_mv |
Filomena, Tiago Pascoal |
dc.subject.por.fl_str_mv |
Administração financeira Análise de crédito |
topic |
Administração financeira Análise de crédito Credit scoring Machine learning Feature selection VNS - Variable Neighborhood Search |
dc.subject.eng.fl_str_mv |
Credit scoring Machine learning Feature selection VNS - Variable Neighborhood Search |
description |
Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-07-31T04:41:07Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/224861 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001129311 |
url |
http://hdl.handle.net/10183/224861 |
identifier_str_mv |
001129311 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/224861/2/001129311.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/224861/1/001129311.pdf |
bitstream.checksum.fl_str_mv |
3555f90eead5bd70a96d294e01021206 1c7b4861ef444e612839d228aacdfa31 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085560676515840 |