Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados

Detalhes bibliográficos
Autor(a) principal: Silva, Vitória de Oliveira
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/217502
Resumo: Com o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados.
id UNSP_e1331750e5325e2fbfbb794aa1a69a5a
oai_identifier_str oai:repositorio.unesp.br:11449/217502
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceadosFraud detection in the use of cards using the logistic regression technique: an application with unbalanced dataDetecção de fraudeDados desbalanceadosRegressão logísticaFraud detectionUnbalanced dataLogistic regressionCom o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados.Over the years, the number of credit and debit card frauds has been growing and the ways fraudsters act are innovated daily. This is due to the rise in the use of cards as a form of payment, which accompanies the advancement of technology. To identify frauds and the actions behind them, it is necessary to resort to strategies, studies and statistical techniques that will help to predict and detect fraud occurrences. A common situation in these cases is that the proportion of fraud is very small compared to non-fraud, consequently, the data becomes unbalanced and needs to be treated. In the present work, the Oversampling and Undersampling techniques were used to balance the data used and the Logistic Regression technique to detect fraudulent credit and debit card transactions. For the application, synthetic data generated by a simulator were used, which is based on a sample of real data. There was a severe imbalance in the data, considering that only 1.3% of the base, after the proper treatment, were fraudulent transactions. Thus, three applications of the model were made, one with unbalanced data and the other two using balancing methods, and it was noted that Undersampling was the method that presented the best results.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Tarumoto, Olga Lyda Anglas Rosales [UNESP]Tarumoto, Mário HissamitsuUniversidade Estadual Paulista (Unesp)Silva, Vitória de Oliveira2022-03-30T13:16:33Z2022-03-30T13:16:33Z2022-03-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/217502porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-07T06:14:39Zoai:repositorio.unesp.br:11449/217502Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T17:06:33.412430Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
Fraud detection in the use of cards using the logistic regression technique: an application with unbalanced data
title Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
spellingShingle Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
Silva, Vitória de Oliveira
Detecção de fraude
Dados desbalanceados
Regressão logística
Fraud detection
Unbalanced data
Logistic regression
title_short Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
title_full Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
title_fullStr Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
title_full_unstemmed Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
title_sort Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
author Silva, Vitória de Oliveira
author_facet Silva, Vitória de Oliveira
author_role author
dc.contributor.none.fl_str_mv Tarumoto, Olga Lyda Anglas Rosales [UNESP]
Tarumoto, Mário Hissamitsu
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Silva, Vitória de Oliveira
dc.subject.por.fl_str_mv Detecção de fraude
Dados desbalanceados
Regressão logística
Fraud detection
Unbalanced data
Logistic regression
topic Detecção de fraude
Dados desbalanceados
Regressão logística
Fraud detection
Unbalanced data
Logistic regression
description Com o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados.
publishDate 2022
dc.date.none.fl_str_mv 2022-03-30T13:16:33Z
2022-03-30T13:16:33Z
2022-03-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/217502
url http://hdl.handle.net/11449/217502
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128756521369600