Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/62427 |
Resumo: | Dissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and Management |
id |
RCAP_317f64624d9353923241c286ffe374f7 |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/62427 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaultsCredit ScoringMachine LearningPredictive ModellingStacking EnsembleFreddie MacLogistic RegressionDecision TreeRandom ForestK-Nearest NeighborsSupport Vector MachineRegressão logísticaDissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and ManagementTo effectively manage credit score analysis, financial institutions instigated techniques and models that are mainly designed for the purpose of improving the process assessing creditworthiness during the credit evaluation process. The foremost objective is to discriminate their clients – borrowers – to fall either in the non-defaulter group, that is more likely to pay their financial obligations, or the defaulter one which has a higher probability of failing to pay their debts. In this paper, we devote to use machine learning models in the prediction of mortgage defaults. This study employs various single classification machine learning methodologies including Logistic Regression, Classification and Regression Trees, Random Forest, K-Nearest Neighbors, and Support Vector Machine. To further improve the predictive power, a meta-algorithm ensemble approach – stacking – will be introduced to combine the outputs – probabilities – of the afore mentioned methods. The sample for this study is solely based on the publicly provided dataset by Freddie Mac. By modelling this approach, we achieve an improvement in the model predictability performance. We then compare the performance of each model, and the meta-learner, by plotting the ROC Curve and computing the AUC rate. This study is an extension of various preceding studies that used different techniques to further enhance the model predictivity. Finally, our results are compared with work from different authors.Para gerir com eficácia a análise de risco de crédito, as instituições financeiras desenvolveram técnicas e modelos que foram projetados principalmente para melhorar o processo de avaliação da qualidade de crédito durante o processo de avaliação de crédito. O objetivo final é classifica os seus clientes - tomadores de empréstimos - entre aqueles que tem maior probabilidade de pagar suas obrigações financeiras, e os potenciais incumpridores que têm maior probabilidade de entrar em default. Neste artigo, nos dedicamos a usar modelos de aprendizado de máquina na previsão de defaults de hipoteca. Este estudo emprega várias metodologias de aprendizado de máquina de classificação única, incluindo Regressão Logística, Classification and Regression Trees, Random Forest, K-Nearest Neighbors, and Support Vector Machine. Para melhorar ainda mais o poder preditivo, a abordagem do conjunto de meta-algoritmos - stacking - será introduzida para combinar as saídas - probabilidades - dos métodos acima mencionados. A amostra deste estudo é baseada exclusivamente no conjunto de dados fornecido publicamente pela Freddie Mac. Ao modelar essa abordagem, alcançamos uma melhoria no desempenho do modelo de previsibilidade. Em seguida, comparamos o desempenho de cada modelo e o meta-aprendiz, plotando a Curva ROC e calculando a taxa de AUC. Este estudo é uma extensão de vários estudos anteriores que usaram diferentes técnicas para melhorar ainda mais o modelo preditivo. Finalmente, nossos resultados são comparados com trabalhos de diferentes autores.Bravo, Jorge Miguel VenturaRUNElmasry, Mohamed Hani Abdelhamid Mohamed Tawfik2019-03-06T18:00:13Z2019-02-082019-02-08T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/62427TID:202184765enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T04:29:31Zoai:run.unl.pt:10362/62427Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:33:45.320805Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
title |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
spellingShingle |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik Credit Scoring Machine Learning Predictive Modelling Stacking Ensemble Freddie Mac Logistic Regression Decision Tree Random Forest K-Nearest Neighbors Support Vector Machine Regressão logística |
title_short |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
title_full |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
title_fullStr |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
title_full_unstemmed |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
title_sort |
Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults |
author |
Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik |
author_facet |
Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bravo, Jorge Miguel Ventura RUN |
dc.contributor.author.fl_str_mv |
Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik |
dc.subject.por.fl_str_mv |
Credit Scoring Machine Learning Predictive Modelling Stacking Ensemble Freddie Mac Logistic Regression Decision Tree Random Forest K-Nearest Neighbors Support Vector Machine Regressão logística |
topic |
Credit Scoring Machine Learning Predictive Modelling Stacking Ensemble Freddie Mac Logistic Regression Decision Tree Random Forest K-Nearest Neighbors Support Vector Machine Regressão logística |
description |
Dissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and Management |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-03-06T18:00:13Z 2019-02-08 2019-02-08T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/62427 TID:202184765 |
url |
http://hdl.handle.net/10362/62427 |
identifier_str_mv |
TID:202184765 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137959280115712 |