Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults

Detalhes bibliográficos
Autor(a) principal: Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/62427
Resumo: Dissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and Management
id RCAP_317f64624d9353923241c286ffe374f7
oai_identifier_str oai:run.unl.pt:10362/62427
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaultsCredit ScoringMachine LearningPredictive ModellingStacking EnsembleFreddie MacLogistic RegressionDecision TreeRandom ForestK-Nearest NeighborsSupport Vector MachineRegressão logísticaDissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and ManagementTo effectively manage credit score analysis, financial institutions instigated techniques and models that are mainly designed for the purpose of improving the process assessing creditworthiness during the credit evaluation process. The foremost objective is to discriminate their clients – borrowers – to fall either in the non-defaulter group, that is more likely to pay their financial obligations, or the defaulter one which has a higher probability of failing to pay their debts. In this paper, we devote to use machine learning models in the prediction of mortgage defaults. This study employs various single classification machine learning methodologies including Logistic Regression, Classification and Regression Trees, Random Forest, K-Nearest Neighbors, and Support Vector Machine. To further improve the predictive power, a meta-algorithm ensemble approach – stacking – will be introduced to combine the outputs – probabilities – of the afore mentioned methods. The sample for this study is solely based on the publicly provided dataset by Freddie Mac. By modelling this approach, we achieve an improvement in the model predictability performance. We then compare the performance of each model, and the meta-learner, by plotting the ROC Curve and computing the AUC rate. This study is an extension of various preceding studies that used different techniques to further enhance the model predictivity. Finally, our results are compared with work from different authors.Para gerir com eficácia a análise de risco de crédito, as instituições financeiras desenvolveram técnicas e modelos que foram projetados principalmente para melhorar o processo de avaliação da qualidade de crédito durante o processo de avaliação de crédito. O objetivo final é classifica os seus clientes - tomadores de empréstimos - entre aqueles que tem maior probabilidade de pagar suas obrigações financeiras, e os potenciais incumpridores que têm maior probabilidade de entrar em default. Neste artigo, nos dedicamos a usar modelos de aprendizado de máquina na previsão de defaults de hipoteca. Este estudo emprega várias metodologias de aprendizado de máquina de classificação única, incluindo Regressão Logística, Classification and Regression Trees, Random Forest, K-Nearest Neighbors, and Support Vector Machine. Para melhorar ainda mais o poder preditivo, a abordagem do conjunto de meta-algoritmos - stacking - será introduzida para combinar as saídas - probabilidades - dos métodos acima mencionados. A amostra deste estudo é baseada exclusivamente no conjunto de dados fornecido publicamente pela Freddie Mac. Ao modelar essa abordagem, alcançamos uma melhoria no desempenho do modelo de previsibilidade. Em seguida, comparamos o desempenho de cada modelo e o meta-aprendiz, plotando a Curva ROC e calculando a taxa de AUC. Este estudo é uma extensão de vários estudos anteriores que usaram diferentes técnicas para melhorar ainda mais o modelo preditivo. Finalmente, nossos resultados são comparados com trabalhos de diferentes autores.Bravo, Jorge Miguel VenturaRUNElmasry, Mohamed Hani Abdelhamid Mohamed Tawfik2019-03-06T18:00:13Z2019-02-082019-02-08T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/62427TID:202184765enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T04:29:31Zoai:run.unl.pt:10362/62427Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:33:45.320805Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
title Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
spellingShingle Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik
Credit Scoring
Machine Learning
Predictive Modelling
Stacking Ensemble
Freddie Mac
Logistic Regression
Decision Tree
Random Forest
K-Nearest Neighbors
Support Vector Machine
Regressão logística
title_short Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
title_full Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
title_fullStr Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
title_full_unstemmed Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
title_sort Machine learning approach for credit score analysis : a case study of predicting mortgage loan defaults
author Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik
author_facet Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik
author_role author
dc.contributor.none.fl_str_mv Bravo, Jorge Miguel Ventura
RUN
dc.contributor.author.fl_str_mv Elmasry, Mohamed Hani Abdelhamid Mohamed Tawfik
dc.subject.por.fl_str_mv Credit Scoring
Machine Learning
Predictive Modelling
Stacking Ensemble
Freddie Mac
Logistic Regression
Decision Tree
Random Forest
K-Nearest Neighbors
Support Vector Machine
Regressão logística
topic Credit Scoring
Machine Learning
Predictive Modelling
Stacking Ensemble
Freddie Mac
Logistic Regression
Decision Tree
Random Forest
K-Nearest Neighbors
Support Vector Machine
Regressão logística
description Dissertation submitted in partial fulfilment of the requirements for the degree of Statistics and Information Management specialized in Risk Analysis and Management
publishDate 2019
dc.date.none.fl_str_mv 2019-03-06T18:00:13Z
2019-02-08
2019-02-08T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/62427
TID:202184765
url http://hdl.handle.net/10362/62427
identifier_str_mv TID:202184765
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137959280115712