Combinação de classificadores para inferência dos rejeitados

Detalhes bibliográficos
Autor(a) principal: Rocha, Ricardo Ferreira da
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/4556
Resumo: In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain.
id SCAR_29fc30355a0d68c14e7cb90096ed56da
oai_identifier_str oai:repositorio.ufscar.br:ufscar/4556
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Rocha, Ricardo Ferreira daLouzada Neto, Franciscohttp://lattes.cnpq.br/0994050156415890http://lattes.cnpq.br/0676420269735630bba38e35-6e61-4d3d-81e3-d24c4cd3862b2016-06-02T20:06:06Z2012-05-112016-06-02T20:06:06Z2012-03-16ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.https://repositorio.ufscar.br/handle/ufscar/4556In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain.Em problemas de credit scoring, o interesse é associar a um elemento solicitante de algum tipo de crédito, uma probabilidade de inadimplência. No entanto, os modelos tradicionais utilizam amostras viesadas, pois constam apenas de dados obtidos dos proponentes que conseguiram a aprovação de uma solicitação de crédito anterior. Com o intuito de reduzir o vício amostral desses modelos, utilizamos estratégias para extrair informações acerca dos indivíduos rejeitados para que nele seja inferida uma resposta do tipo bom/- mau pagador. Isto é o que chamamos de inferência dos rejeitados. Juntamente com o uso dessas estratégias utilizamos a técnica bagging (bootstrap aggregating ), que é baseada na construção de diversos modelos a partir de réplicas bootstrap dos dados de treinamento, de modo que, quando combinados, gera um novo preditor. Nesse trabalho discutiremos sobre alguns dos métodos de combinação presentes na literatura, em especial o método de combinação via regressão logística, que é ainda pouco utilizado, mas com resultados interessantes. Discutiremos também as principais estratégias referentes à inferência dos rejeitados. As análises se dão por meio de um estudo simulação, em conjuntos de dados gerados e em conjuntos de dados reais de domínio público.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatísticaRiscos FinanceirosCombinação de classificadoresCredit scoringRegressão logísticaBaggingCombinação de modelosInferência dos rejeitadosBaggingCredit scoringLogistic regressionModel combinationReject inferenceCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICACombinação de classificadores para inferência dos rejeitadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-1d0f3b31a-38c4-4c28-aa5b-837ad377108einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL4300.pdfapplication/pdf2695135https://repositorio.ufscar.br/bitstream/ufscar/4556/1/4300.pdfc7742258a75f77aa35ccb54abc3439feMD51TEXT4300.pdf.txt4300.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/4556/2/4300.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL4300.pdf.jpg4300.pdf.jpgIM Thumbnailimage/jpeg4713https://repositorio.ufscar.br/bitstream/ufscar/4556/3/4300.pdf.jpgc01774368a0409d3b60d8a7012bbf6daMD53ufscar/45562023-09-18 18:31:34.626oai:repositorio.ufscar.br:ufscar/4556Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:34Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Combinação de classificadores para inferência dos rejeitados
title Combinação de classificadores para inferência dos rejeitados
spellingShingle Combinação de classificadores para inferência dos rejeitados
Rocha, Ricardo Ferreira da
Estatística
Riscos Financeiros
Combinação de classificadores
Credit scoring
Regressão logística
Bagging
Combinação de modelos
Inferência dos rejeitados
Bagging
Credit scoring
Logistic regression
Model combination
Reject inference
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Combinação de classificadores para inferência dos rejeitados
title_full Combinação de classificadores para inferência dos rejeitados
title_fullStr Combinação de classificadores para inferência dos rejeitados
title_full_unstemmed Combinação de classificadores para inferência dos rejeitados
title_sort Combinação de classificadores para inferência dos rejeitados
author Rocha, Ricardo Ferreira da
author_facet Rocha, Ricardo Ferreira da
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0676420269735630
dc.contributor.author.fl_str_mv Rocha, Ricardo Ferreira da
dc.contributor.advisor1.fl_str_mv Louzada Neto, Francisco
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0994050156415890
dc.contributor.authorID.fl_str_mv bba38e35-6e61-4d3d-81e3-d24c4cd3862b
contributor_str_mv Louzada Neto, Francisco
dc.subject.por.fl_str_mv Estatística
Riscos Financeiros
Combinação de classificadores
Credit scoring
Regressão logística
Bagging
Combinação de modelos
Inferência dos rejeitados
topic Estatística
Riscos Financeiros
Combinação de classificadores
Credit scoring
Regressão logística
Bagging
Combinação de modelos
Inferência dos rejeitados
Bagging
Credit scoring
Logistic regression
Model combination
Reject inference
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.eng.fl_str_mv Bagging
Credit scoring
Logistic regression
Model combination
Reject inference
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description In credit scoring problems, the interest is to associate to an element who request some kind of credit, a probability of default. However, traditional models uses samples biased because the data obtained from the tenderers has only clients who won a approval of a request for previous credit. In order to reduce the bias sample of these models, we use strategies to extract information about individuals rejected to be able to infer a response, good or bad payer. This is what we call the reject inference. With the use of these strategies, we also use the bagging technique (bootstrap aggregating), which consist in generate models based in some bootstrap samples of the training data in order to get a new predictor, when these models is combined. In this work we will discuss about some of the combination methods in the literature, especially the method of combination by logistic regression, although little used but with interesting results.We'll also discuss some strategies relating to reject inference. Analyses are given through a simulation study, in data sets generated and real data sets of public domain.
publishDate 2012
dc.date.available.fl_str_mv 2012-05-11
2016-06-02T20:06:06Z
dc.date.issued.fl_str_mv 2012-03-16
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/4556
identifier_str_mv ROCHA, Ricardo Ferreira da. Combinação de classificadores para inferência dos rejeitados. 2012. 58 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2012.
url https://repositorio.ufscar.br/handle/ufscar/4556
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv d0f3b31a-38c4-4c28-aa5b-837ad377108e
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/4556/1/4300.pdf
https://repositorio.ufscar.br/bitstream/ufscar/4556/2/4300.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/4556/3/4300.pdf.jpg
bitstream.checksum.fl_str_mv c7742258a75f77aa35ccb54abc3439fe
d41d8cd98f00b204e9800998ecf8427e
c01774368a0409d3b60d8a7012bbf6da
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1813715536868016128