Combinação de classificadores para inferência dos rejeitados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/4556 |
Resumo: | In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain. |
id |
SCAR_29fc30355a0d68c14e7cb90096ed56da |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/4556 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Rocha, Ricardo Ferreira daLouzada Neto, Franciscohttp://lattes.cnpq.br/0994050156415890http://lattes.cnpq.br/0676420269735630bba38e35-6e61-4d3d-81e3-d24c4cd3862b2016-06-02T20:06:06Z2012-05-112016-06-02T20:06:06Z2012-03-16ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.https://repositorio.ufscar.br/handle/ufscar/4556In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain.Em problemas de credit scoring, o interesse é associar a um elemento solicitante de algum tipo de crédito, uma probabilidade de inadimplência. No entanto, os modelos tradicionais utilizam amostras viesadas, pois constam apenas de dados obtidos dos proponentes que conseguiram a aprovação de uma solicitação de crédito anterior. Com o intuito de reduzir o vício amostral desses modelos, utilizamos estratégias para extrair informações acerca dos indivíduos rejeitados para que nele seja inferida uma resposta do tipo bom/- mau pagador. Isto é o que chamamos de inferência dos rejeitados. Juntamente com o uso dessas estratégias utilizamos a técnica bagging (bootstrap aggregating ), que é baseada na construção de diversos modelos a partir de réplicas bootstrap dos dados de treinamento, de modo que, quando combinados, gera um novo preditor. Nesse trabalho discutiremos sobre alguns dos métodos de combinação presentes na literatura, em especial o método de combinação via regressão logística, que é ainda pouco utilizado, mas com resultados interessantes. Discutiremos também as principais estratégias referentes à inferência dos rejeitados. As análises se dão por meio de um estudo simulação, em conjuntos de dados gerados e em conjuntos de dados reais de domínio público.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatísticaRiscos FinanceirosCombinação de classificadoresCredit scoringRegressão logísticaBaggingCombinação de modelosInferência dos rejeitadosBaggingCredit scoringLogistic regressionModel combinationReject inferenceCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICACombinação de classificadores para inferência dos rejeitadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1d0f3b31a-38c4-4c28-aa5b-837ad377108einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL4300.pdfapplication/pdf2695135https://repositorio.ufscar.br/bitstream/ufscar/4556/1/4300.pdfc7742258a75f77aa35ccb54abc3439feMD51TEXT4300.pdf.txt4300.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/4556/2/4300.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL4300.pdf.jpg4300.pdf.jpgIM Thumbnailimage/jpeg4713https://repositorio.ufscar.br/bitstream/ufscar/4556/3/4300.pdf.jpgc01774368a0409d3b60d8a7012bbf6daMD53ufscar/45562023-09-18 18:31:34.626oai:repositorio.ufscar.br:ufscar/4556Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:34Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Combinação de classificadores para inferência dos rejeitados |
title |
Combinação de classificadores para inferência dos rejeitados |
spellingShingle |
Combinação de classificadores para inferência dos rejeitados Rocha, Ricardo Ferreira da Estatística Riscos Financeiros Combinação de classificadores Credit scoring Regressão logística Bagging Combinação de modelos Inferência dos rejeitados Bagging Credit scoring Logistic regression Model combination Reject inference CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
title_short |
Combinação de classificadores para inferência dos rejeitados |
title_full |
Combinação de classificadores para inferência dos rejeitados |
title_fullStr |
Combinação de classificadores para inferência dos rejeitados |
title_full_unstemmed |
Combinação de classificadores para inferência dos rejeitados |
title_sort |
Combinação de classificadores para inferência dos rejeitados |
author |
Rocha, Ricardo Ferreira da |
author_facet |
Rocha, Ricardo Ferreira da |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/0676420269735630 |
dc.contributor.author.fl_str_mv |
Rocha, Ricardo Ferreira da |
dc.contributor.advisor1.fl_str_mv |
Louzada Neto, Francisco |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0994050156415890 |
dc.contributor.authorID.fl_str_mv |
bba38e35-6e61-4d3d-81e3-d24c4cd3862b |
contributor_str_mv |
Louzada Neto, Francisco |
dc.subject.por.fl_str_mv |
Estatística Riscos Financeiros Combinação de classificadores Credit scoring Regressão logística Bagging Combinação de modelos Inferência dos rejeitados |
topic |
Estatística Riscos Financeiros Combinação de classificadores Credit scoring Regressão logística Bagging Combinação de modelos Inferência dos rejeitados Bagging Credit scoring Logistic regression Model combination Reject inference CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
dc.subject.eng.fl_str_mv |
Bagging Credit scoring Logistic regression Model combination Reject inference |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
description |
In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain. |
publishDate |
2012 |
dc.date.available.fl_str_mv |
2012-05-11 2016-06-02T20:06:06Z |
dc.date.issued.fl_str_mv |
2012-03-16 |
dc.date.accessioned.fl_str_mv |
2016-06-02T20:06:06Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/4556 |
identifier_str_mv |
ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012. |
url |
https://repositorio.ufscar.br/handle/ufscar/4556 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
d0f3b31a-38c4-4c28-aa5b-837ad377108e |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística - PPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/4556/1/4300.pdf https://repositorio.ufscar.br/bitstream/ufscar/4556/2/4300.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/4556/3/4300.pdf.jpg |
bitstream.checksum.fl_str_mv |
c7742258a75f77aa35ccb54abc3439fe d41d8cd98f00b204e9800998ecf8427e c01774368a0409d3b60d8a7012bbf6da |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1813715536868016128 |