Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/ |
Resumo: | A demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma correta |
id |
USP_741ccbd95dd424267669e850c899410e |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-09082019-110750 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Aplicação de Redes Bayesianas em modelos de classificação de risco de créditoApplication of Bayesian Networks in models of classification of credit riskBayesian networksCredit modelingCredit riskCredit scoreModelagem de créditoPontuação de créditoRedes BayesianasRisco de créditoA demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma corretaThe demand for studies and enhancement of credit models that helps at the decision making, associated with the granting credit, grows in a high speed. In the face of the recent troubles of financial order that accomplish innumerous countries nowadays, including Brasil, financial authorities have shown an increasing concern, as well as, the financial institutions that plays at the market for credit models. The challenge of search for informations that shows the financial health\'s companies - information asymmetry - together with the lack of data at the financial market contribute to increase the number of default cases and number of companies that fails. Due to the issues and difficulties described, this research used the probabilistic approach of Bayesian Networks to develop a credit model capable of calculate the credit risk of a company based on a set of financial indexes, obtained by the financial statements of these companies. For that, it was used a set of financial statements, regarding a set of 852 companies with revenues higher than 200 hundred billion reais, obtained through an agreement with the institution Serasa Experian. These financial statements were used to calculate the financial indexes through the formulae adopted by Serasa Experian, which gave the inicial set of the Bayesian Network. The Network technique was used through an algorithm called Pc Algorithm, that mix elements of probabilistic graphs with conditional\'s probability definitions, to select variables, represented by financials indexes, that are more significant to the calculation of credit\'s risk. Besides that, it was made a comparison between Bayesian Network and Logistic Regression technique, with the purpose of verify which one was the best to this set of variables. After the technique was implemented, it was also developed an application, capable of calculate the credit risk of a corporation, using a dataset of seventeen financial indexes. As a result, the app shows to the final user which of the thirteen risk\'s classes, has the biggest chance of being associated with the enterprise. To validate the technique it were employed two measurements, the RMSE(root mean square error) and the MAE( mean absolute error). The measurements showed that the Bayesian Networks model was not very predictive to the sample of companies which it was trained, since the outcomes fell short of expectations. On the other hand, the Logistic Regression technique showed better results when compared with the Bayesian Network technique. The percentage of right risk\'s class classifications were much higher, resulting at a percentage of 82% of companies classified as \"low risk\" , in the right wayBiblioteca Digitais de Teses e Dissertações da USPRibeiro, Evandro Marcos SaidelFernandes, Luís Felipe Barbosa2019-06-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-11-08T20:55:08Zoai:teses.usp.br:tde-09082019-110750Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-11-08T20:55:08Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito Application of Bayesian Networks in models of classification of credit risk |
title |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
spellingShingle |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito Fernandes, Luís Felipe Barbosa Bayesian networks Credit modeling Credit risk Credit score Modelagem de crédito Pontuação de crédito Redes Bayesianas Risco de crédito |
title_short |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
title_full |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
title_fullStr |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
title_full_unstemmed |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
title_sort |
Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito |
author |
Fernandes, Luís Felipe Barbosa |
author_facet |
Fernandes, Luís Felipe Barbosa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ribeiro, Evandro Marcos Saidel |
dc.contributor.author.fl_str_mv |
Fernandes, Luís Felipe Barbosa |
dc.subject.por.fl_str_mv |
Bayesian networks Credit modeling Credit risk Credit score Modelagem de crédito Pontuação de crédito Redes Bayesianas Risco de crédito |
topic |
Bayesian networks Credit modeling Credit risk Credit score Modelagem de crédito Pontuação de crédito Redes Bayesianas Risco de crédito |
description |
A demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma correta |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-06-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/ |
url |
http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090552887508992 |