O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?

Detalhes bibliográficos
Autor(a) principal: Pinto, Alex Cerqueira
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional do IDP
Texto Completo: https://repositorio.idp.edu.br//handle/123456789/3056
Resumo: O objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva.
id IDP-1_bf52af70778ac52aeaff796caea20bcb
oai_identifier_str oai:repositorio.idp.edu.br:123456789/3056
network_acronym_str IDP-1
network_name_str Repositório Institucional do IDP
repository_id_str
spelling O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?Risco de créditoAprendizado de máquinaIndicadores financeirosModeloO objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva.The purpose of this paper was to develop models for predicting credit risk, to verify if models using machine learning have a better predictive character compared to traditional logistic regression. Likewise, as a specific objective, to apply interpretability techniques to the best performance model. The methodology adopted corresponds to an empirical econometric research using supervised learning techniques. The target audience was wholesale companies, which have registrations with the Brazilian Securities and Exchange Commission (CVM). The model variables were economic and financial indicators, taken from the companies' accounting and equity statements, and macroeconomic information. The results indicate that the model with the best predictive capacity was the XGBoost, with a RCO curve at the test base of 0.99 and accuracy of 0.98 Likewise, the main predictive variables were the indicators of PL/Total Liabilities, Retained/Active Profits, Dry Liquidity, Inventory /Assets and Working Capital Need (NCG). In the analysis of interpretability via Sharp value, the results corroborate the interpretation of the importance and economic sense of the variables. Thus, the Sharp value indicates an inverse relationship between the variables Equity/Total Liabilities, Dry Liquidity and Retained Earnings/Assets and the predicted value. Likewise, the interpretability via interactions showed that, for the model, the variables PL/Total Liabilities, NCG, Retained Earnings/Assets and Inventory/Assets are those that present stronger interactions with the other variables, especially among themselves and together with the NCG and STV variables. These results corroborate the growth trend in the use of models with the use of machine learning techniques in the economic area, as they often have better predictive capacity.IDP/EABCarvalho, Alexandre Xavier Ywata dePinto, Alex Cerqueira2021-04-16T11:39:37Z2021-04-16T11:39:37Z2021-042020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021.https://repositorio.idp.edu.br//handle/123456789/3056porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IDPinstname:Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)instacron:IDP2021-04-16T11:40:27Zoai:repositorio.idp.edu.br:123456789/3056Biblioteca Digital de Teses e DissertaçõesPRIhttps://repositorio.idp.edu.br/oai/requestbiblioteca@idp.edu.bropendoar:2024-09-05T12:27:59.320736Repositório Institucional do IDP - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)false
dc.title.none.fl_str_mv O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
title O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
spellingShingle O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
Pinto, Alex Cerqueira
Risco de crédito
Aprendizado de máquina
Indicadores financeiros
Modelo
title_short O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
title_full O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
title_fullStr O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
title_full_unstemmed O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
title_sort O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito?
author Pinto, Alex Cerqueira
author_facet Pinto, Alex Cerqueira
author_role author
dc.contributor.none.fl_str_mv Carvalho, Alexandre Xavier Ywata de
dc.contributor.author.fl_str_mv Pinto, Alex Cerqueira
dc.subject.por.fl_str_mv Risco de crédito
Aprendizado de máquina
Indicadores financeiros
Modelo
topic Risco de crédito
Aprendizado de máquina
Indicadores financeiros
Modelo
description O objetivo desse trabalho foi desenvolver modelos para previsão do risco de crédito, para verificar se modelos com uso de aprendizado de máquina apresentam melhor caráter preditivo comparado a tradicional regressão logística. Do mesmo modo, como objetivo específico, aplicar técnicas de interpretabilidade ao modelo de melhor performance, A metodologia adotada corresponde a uma pesquisa empírica econométrica com o uso das técnicas de aprendizado supervisionado. O público alvo foram empresas do segmento atacado, que possuem registros na Comissão de Valores Mobiliários (CVM). Para as variáveis do modelo foram utilizados indicadores econômicos e financeiros, retirados das demonstrações contábeis e patrimoniais das empresas, e também variáveis macroeconômicas. Os resultados indicam que o modelo de melhor capacidade preditiva foi o XGBoost, com curva ROC na base teste de 0.99 e acurácia de 0.98 Do mesmo modo, as principais variáveis preditivas foram os indicadores de PL/Exigível Total, Lucros Retidos/Ativos, Liquidez Seca, Estoque/Ativos e Necessidade de Capital de Giro (NCG). Na análise de interpretabilidade via Sharp value, os resultados corroboram a intepretação da importância e sentido econômico das variáveis. Assim, o Sharp value indica uma relação inversa entre as variáveis PL/Exigível Total, Liquidez Seca e Lucros Retidos/Ativos e o valor predito. Do mesmo modo, a interpretabilidade via interações mostrou que, para o modelo, as variáveis PL/Exigível Total, Necessidade de Capital de Giro, Lucros Retidos /Ativos e Estoque/Ativos são as que apresentam interações mais fortes com as demais variáveis. Estes resultados corroboram a tendência de crescimento do uso dos modelos com uso de técnicas de machine learning na área econômica por, muitas vezes, apresentarem melhor capacidade preditiva.
publishDate 2020
dc.date.none.fl_str_mv 2020
2021-04-16T11:39:37Z
2021-04-16T11:39:37Z
2021-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021.
https://repositorio.idp.edu.br//handle/123456789/3056
identifier_str_mv PINTO, Alex Cerqueira.O poder preditivo dos modelos com aprendizado de máquina é superior aos modelos tradicionais para análise do risco de crédito? 2020. 34 f. Dissertação (Mestrado Profissional em Economia) – Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa, Brasília, 2021.
url https://repositorio.idp.edu.br//handle/123456789/3056
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv IDP/EAB
publisher.none.fl_str_mv IDP/EAB
dc.source.none.fl_str_mv reponame:Repositório Institucional do IDP
instname:Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)
instacron:IDP
instname_str Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)
instacron_str IDP
institution IDP
reponame_str Repositório Institucional do IDP
collection Repositório Institucional do IDP
repository.name.fl_str_mv Repositório Institucional do IDP - Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP)
repository.mail.fl_str_mv biblioteca@idp.edu.br
_version_ 1809385927525531648