O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional do IDP |
Texto Completo: | https://repositorio.idp.edu.br//handle/123456789/3056 |
Resumo: | O objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva. |
id |
IDP-1_bf52af70778ac52aeaff796caea20bcb |
---|---|
oai_identifier_str |
oai:repositorio.idp.edu.br:123456789/3056 |
network_acronym_str |
IDP-1 |
network_name_str |
Repositório Institucional do IDP |
repository_id_str |
|
spelling |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?Risco de créditoAprendizado de máquinaIndicadores financeirosModeloO objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva.The purpose of this paper was to develop models for predicting credit risk, to verify if models using machine learning have a better predictive character compared to traditional logistic regression. Likewise, as a specific objective, to apply interpretability techniques to the best performance model. The methodology adopted corresponds to an empirical econometric research using supervised learning techniques. The target audience was wholesale companies, which have registrations with the Brazilian Securities and Exchange Commission (CVM). The model variables were economic and financial indicators, taken from the companies' accounting and equity statements, and macroeconomic information. The results indicate that the model with the best predictive capacity was the XGBoost, with a RCO curve at the test base of 0.99 and accuracy of 0.98 Likewise, the main predictive variables were the indicators of PL/Total Liabilities, Retained/Active Profits, Dry Liquidity, Inventory /Assets and Working Capital Need (NCG). In the analysis of interpretability via Sharp value, the results corroborate the interpretation of the importance and economic sense of the variables. Thus, the Sharp value indicates an inverse relationship between the variables Equity/Total Liabilities, Dry Liquidity and Retained Earnings/Assets and the predicted value. Likewise, the interpretability via interactions showed that, for the model, the variables PL/Total Liabilities, NCG, Retained Earnings/Assets and Inventory/Assets are those that present stronger interactions with the other variables, especially among themselves and together with the NCG and STV variables. These results corroborate the growth trend in the use of models with the use of machine learning techniques in the economic area, as they often have better predictive capacity.IDP/EABCarvalho, Alexandre Xavier Ywata dePinto, Alex Cerqueira2021-04-16T11:39:37Z2021-04-16T11:39:37Z2021-042020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021.https://repositorio.idp.edu.br//handle/123456789/3056porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IDPinstname:Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)instacron:IDP2021-04-16T11:40:27Zoai:repositorio.idp.edu.br:123456789/3056Biblioteca Digital de Teses e DissertaçõesPRIhttps://repositorio.idp.edu.br/oai/requestbiblioteca@idp.edu.bropendoar:2024-09-05T12:27:59.320736Repositório Institucional do IDP - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)false |
dc.title.none.fl_str_mv |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
title |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
spellingShingle |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? Pinto, Alex Cerqueira Risco de crédito Aprendizado de máquina Indicadores financeiros Modelo |
title_short |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
title_full |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
title_fullStr |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
title_full_unstemmed |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
title_sort |
O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? |
author |
Pinto, Alex Cerqueira |
author_facet |
Pinto, Alex Cerqueira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carvalho, Alexandre Xavier Ywata de |
dc.contributor.author.fl_str_mv |
Pinto, Alex Cerqueira |
dc.subject.por.fl_str_mv |
Risco de crédito Aprendizado de máquina Indicadores financeiros Modelo |
topic |
Risco de crédito Aprendizado de máquina Indicadores financeiros Modelo |
description |
O objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2021-04-16T11:39:37Z 2021-04-16T11:39:37Z 2021-04 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021. https://repositorio.idp.edu.br//handle/123456789/3056 |
identifier_str_mv |
PINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021. |
url |
https://repositorio.idp.edu.br//handle/123456789/3056 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
IDP/EAB |
publisher.none.fl_str_mv |
IDP/EAB |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional do IDP instname:Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP) instacron:IDP |
instname_str |
Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP) |
instacron_str |
IDP |
institution |
IDP |
reponame_str |
Repositório Institucional do IDP |
collection |
Repositório Institucional do IDP |
repository.name.fl_str_mv |
Repositório Institucional do IDP - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP) |
repository.mail.fl_str_mv |
biblioteca@idp.edu.br |
_version_ |
1809385927525531648 |