Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/217502 |
Resumo: | Com o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados. |
id |
UNSP_e1331750e5325e2fbfbb794aa1a69a5a |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/217502 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceadosFraud detection in the use of cards using the logistic regression technique: an application with unbalanced dataDetecção de fraudeDados desbalanceadosRegressão logísticaFraud detectionUnbalanced dataLogistic regressionCom o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados.Over the years, the number of credit and debit card frauds has been growing and the ways fraudsters act are innovated daily. This is due to the rise in the use of cards as a form of payment, which accompanies the advancement of technology. To identify frauds and the actions behind them, it is necessary to resort to strategies, studies and statistical techniques that will help to predict and detect fraud occurrences. A common situation in these cases is that the proportion of fraud is very small compared to non-fraud, consequently, the data becomes unbalanced and needs to be treated. In the present work, the Oversampling and Undersampling techniques were used to balance the data used and the Logistic Regression technique to detect fraudulent credit and debit card transactions. For the application, synthetic data generated by a simulator were used, which is based on a sample of real data. There was a severe imbalance in the data, considering that only 1.3% of the base, after the proper treatment, were fraudulent transactions. Thus, three applications of the model were made, one with unbalanced data and the other two using balancing methods, and it was noted that Undersampling was the method that presented the best results.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Tarumoto, Olga Lyda Anglas Rosales [UNESP]Tarumoto, Mário HissamitsuUniversidade Estadual Paulista (Unesp)Silva, Vitória de Oliveira2022-03-30T13:16:33Z2022-03-30T13:16:33Z2022-03-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/217502porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-07T06:14:39Zoai:repositorio.unesp.br:11449/217502Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T17:06:33.412430Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados Fraud detection in the use of cards using the logistic regression technique: an application with unbalanced data |
title |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
spellingShingle |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados Silva, Vitória de Oliveira Detecção de fraude Dados desbalanceados Regressão logística Fraud detection Unbalanced data Logistic regression |
title_short |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
title_full |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
title_fullStr |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
title_full_unstemmed |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
title_sort |
Detecção de fraudes na utilização de cartões usando a técnica de regressão logística: uma aplicação com dados desbalanceados |
author |
Silva, Vitória de Oliveira |
author_facet |
Silva, Vitória de Oliveira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Tarumoto, Olga Lyda Anglas Rosales [UNESP] Tarumoto, Mário Hissamitsu Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Silva, Vitória de Oliveira |
dc.subject.por.fl_str_mv |
Detecção de fraude Dados desbalanceados Regressão logística Fraud detection Unbalanced data Logistic regression |
topic |
Detecção de fraude Dados desbalanceados Regressão logística Fraud detection Unbalanced data Logistic regression |
description |
Com o passar dos anos, o número de fraudes em cartões de crédito e débito vem crescendo e as maneiras como os fraudadores atuam são inovadas diariamente. Isso se dá por conta da ascensão do uso de cartões como forma de pagamento, que acompanha o avanço da tecnologia. Para identificar as fraudes e as atuações por trás delas, é necessário recorrer às estratégias, estudos e técnicas estatísticas que ajudarão a prever e detectar as ocorrências de fraudes. Uma situação comum nestes casos, é que a proporção de fraudes é muito pequena comparada a não fraude, consequentemente, os dados se tornam desbalanceados e necessitam ser tratados. No presente trabalho foram utilizados os métodos de Oversampling e Undersampling para balancear os dados utilizados e a técnica de Regressão Logística para detectar transações realizadas em cartões de crédito e débito que possuem cunho fraudulento. Para a aplicação, foram utilizados dados sintéticos gerados por um simulador, o qual se baseia em uma amostra de dados reais. Observou-se um severo desbalanceamento dos dados, tendo em vista que apenas 1,3% da base, após os devidos tratamentos, eram transações fraudulentas. Assim, foram feitas três aplicações do modelo, sendo uma com os dados desbalanceados e as outras duas usando os métodos de balanceamento, e notou-se que o Undersampling foi o método que apresentou melhores resultados. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-03-30T13:16:33Z 2022-03-30T13:16:33Z 2022-03-26 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/217502 |
url |
http://hdl.handle.net/11449/217502 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808128756521369600 |