Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito

Detalhes bibliográficos
Autor(a) principal: Fernandes, Luís Felipe Barbosa
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/
Resumo: A demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma correta
id USP_741ccbd95dd424267669e850c899410e
oai_identifier_str oai:teses.usp.br:tde-09082019-110750
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Aplicação de Redes Bayesianas em modelos de classificação de risco de créditoApplication of Bayesian Networks in models of classification of credit riskBayesian networksCredit modelingCredit riskCredit scoreModelagem de créditoPontuação de créditoRedes BayesianasRisco de créditoA demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma corretaThe demand for studies and enhancement of credit models that helps at the decision making, associated with the granting credit, grows in a high speed. In the face of the recent troubles of financial order that accomplish innumerous countries nowadays, including Brasil, financial authorities have shown an increasing concern, as well as, the financial institutions that plays at the market for credit models. The challenge of search for informations that shows the financial health\'s companies - information asymmetry - together with the lack of data at the financial market contribute to increase the number of default cases and number of companies that fails. Due to the issues and difficulties described, this research used the probabilistic approach of Bayesian Networks to develop a credit model capable of calculate the credit risk of a company based on a set of financial indexes, obtained by the financial statements of these companies. For that, it was used a set of financial statements, regarding a set of 852 companies with revenues higher than 200 hundred billion reais, obtained through an agreement with the institution Serasa Experian. These financial statements were used to calculate the financial indexes through the formulae adopted by Serasa Experian, which gave the inicial set of the Bayesian Network. The Network technique was used through an algorithm called Pc Algorithm, that mix elements of probabilistic graphs with conditional\'s probability definitions, to select variables, represented by financials indexes, that are more significant to the calculation of credit\'s risk. Besides that, it was made a comparison between Bayesian Network and Logistic Regression technique, with the purpose of verify which one was the best to this set of variables. After the technique was implemented, it was also developed an application, capable of calculate the credit risk of a corporation, using a dataset of seventeen financial indexes. As a result, the app shows to the final user which of the thirteen risk\'s classes, has the biggest chance of being associated with the enterprise. To validate the technique it were employed two measurements, the RMSE(root mean square error) and the MAE( mean absolute error). The measurements showed that the Bayesian Networks model was not very predictive to the sample of companies which it was trained, since the outcomes fell short of expectations. On the other hand, the Logistic Regression technique showed better results when compared with the Bayesian Network technique. The percentage of right risk\'s class classifications were much higher, resulting at a percentage of 82% of companies classified as \"low risk\" , in the right wayBiblioteca Digitais de Teses e Dissertações da USPRibeiro, Evandro Marcos SaidelFernandes, Luís Felipe Barbosa2019-06-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-11-08T20:55:08Zoai:teses.usp.br:tde-09082019-110750Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-11-08T20:55:08Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
Application of Bayesian Networks in models of classification of credit risk
title Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
spellingShingle Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
Fernandes, Luís Felipe Barbosa
Bayesian networks
Credit modeling
Credit risk
Credit score
Modelagem de crédito
Pontuação de crédito
Redes Bayesianas
Risco de crédito
title_short Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
title_full Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
title_fullStr Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
title_full_unstemmed Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
title_sort Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito
author Fernandes, Luís Felipe Barbosa
author_facet Fernandes, Luís Felipe Barbosa
author_role author
dc.contributor.none.fl_str_mv Ribeiro, Evandro Marcos Saidel
dc.contributor.author.fl_str_mv Fernandes, Luís Felipe Barbosa
dc.subject.por.fl_str_mv Bayesian networks
Credit modeling
Credit risk
Credit score
Modelagem de crédito
Pontuação de crédito
Redes Bayesianas
Risco de crédito
topic Bayesian networks
Credit modeling
Credit risk
Credit score
Modelagem de crédito
Pontuação de crédito
Redes Bayesianas
Risco de crédito
description A demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma correta
publishDate 2019
dc.date.none.fl_str_mv 2019-06-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/
url http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090552887508992