Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis

Detalhes bibliográficos
Autor(a) principal: Helder, Victor Gomes
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/224861
Resumo: Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método.
id URGS_2f7c5242af429386cc7ed214fbb1cb9c
oai_identifier_str oai:www.lume.ufrgs.br:10183/224861
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Helder, Victor GomesFilomena, Tiago Pascoal2021-07-31T04:41:07Z2021http://hdl.handle.net/10183/224861001129311Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método.Credit scoring plays a major role for financial institutions when making credit-granting decisions. In this context, machine learning techniques have been used to develop a credit scoring model, as they seek to recognize existing patterns in databases containing the credit history of borrowers to infer potential defaulters. However, these databases often contain a large number of variables, some of which can be noisy, leading to imprecise results. In the present work, a feature selection technique is proposed based on a variable neighborhood concept, so-called VNS. The applicability of the method is assessed in conjunction with seven of the main techniques used to make default prediction in credit analysis problems. Its performance was compared to the feature selection obtained by the well-known PCA statistical method. The results indicate superior performance of the VNS in most of the applied tests, suggesting the robustness of the method.application/pdfporAdministração financeiraAnálise de créditoCredit scoringMachine learningFeature selectionVNS - Variable Neighborhood SearchComparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de AdministraçãoPrograma de Pós-Graduação em AdministraçãoPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001129311.pdf.txt001129311.pdf.txtExtracted Texttext/plain100249http://www.lume.ufrgs.br/bitstream/10183/224861/2/001129311.pdf.txt3555f90eead5bd70a96d294e01021206MD52ORIGINAL001129311.pdfTexto completoapplication/pdf554141http://www.lume.ufrgs.br/bitstream/10183/224861/1/001129311.pdf1c7b4861ef444e612839d228aacdfa31MD5110183/2248612021-08-18 04:37:55.196139oai:www.lume.ufrgs.br:10183/224861Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-08-18T07:37:55Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
title Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
spellingShingle Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
Helder, Victor Gomes
Administração financeira
Análise de crédito
Credit scoring
Machine learning
Feature selection
VNS - Variable Neighborhood Search
title_short Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
title_full Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
title_fullStr Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
title_full_unstemmed Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
title_sort Comparação de técnicas de machine learning para predição de default e aplicação da heurística VNS para seleção de variáveis
author Helder, Victor Gomes
author_facet Helder, Victor Gomes
author_role author
dc.contributor.author.fl_str_mv Helder, Victor Gomes
dc.contributor.advisor1.fl_str_mv Filomena, Tiago Pascoal
contributor_str_mv Filomena, Tiago Pascoal
dc.subject.por.fl_str_mv Administração financeira
Análise de crédito
topic Administração financeira
Análise de crédito
Credit scoring
Machine learning
Feature selection
VNS - Variable Neighborhood Search
dc.subject.eng.fl_str_mv Credit scoring
Machine learning
Feature selection
VNS - Variable Neighborhood Search
description Credit scoring possui um papel fundamental para instituições financeiras no processo de análise para concessão de crédito. Nesse sentido, técnicas de machine learning têm sido utilizadas para desenvolver modelos de credit scoring, uma vez que elas buscam reconhecer padrões existentes em bases de dados contendo o histórico de tomadores de crédito, e assim podem inferir quais indivíduos terão mais propensão a cometer um calote (default). Entretanto, essas bases de dados comumente apresentam um grande número de variáveis, algumas das quais podem ser ruidosas, o que prejudica a análise. No presente trabalho, é proposta uma técnica de seleção de variáveis baseada em um conceito de vizinhança variável, chamado VNS. A aplicabilidade do método é avaliada em conjunto com sete das principais técnicas utilizadas para fazer predição de default em problemas de análise de crédito. Seu desempenho foi comparado com a seleção de variáveis obtida pelo conhecido método estatístico PCA. Os resultados indicam performance superior do VNS na maior parte dos testes aplicados, sugerindo a robustez do método.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-07-31T04:41:07Z
dc.date.issued.fl_str_mv 2021
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/224861
dc.identifier.nrb.pt_BR.fl_str_mv 001129311
url http://hdl.handle.net/10183/224861
identifier_str_mv 001129311
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/224861/2/001129311.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/224861/1/001129311.pdf
bitstream.checksum.fl_str_mv 3555f90eead5bd70a96d294e01021206
1c7b4861ef444e612839d228aacdfa31
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085560676515840