Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://doi.org/10.11606/D.55.2023.tde-23082023-102023 |
Resumo: | As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift. |
id |
USP_569a653f81dc7ee4e28d3fb47189d1ba |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-23082023-102023 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro Credit card fraud detection: a case study of supervised models in brazilian e-commerce 2023-03-31Gustavo Carlos BuscagliaDiego Raphael AmancioFrancisco Aparecido RodriguesGustavo Rocha da SilvaRafael Belmiro CristovãoUniversidade de São PauloMestrado Profissional Matemática, Estatística e Computação Aplicadas à IndústriaUSPBR Cartão de crédito Compra online Credit card Detecção de fraude Ecommerce Ecommerce Fraud Fraud detection Fraude Online purchase As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift. Fraud has grown significantly with the development of new communication technologies and the processes digitalization, resulting in huge financial losses for institutions. Consequently, fraud detection and prevention methods are important topics to explore. Credit card fraud is one of the most frequent type of fraud due to the popularization of online shopping, ease of using third party credit cards and the lack of validation layers, such as password and chip verification, which are commonly used in face-to-face purchases. Many different techniques for extracting features and machine learning algorithms are used to create fraud prevention and detection models. The need to quickly adapt to new types of fraud, unbalanced distributions and the delay in obtaining information on fraudulent transactions are some of the challenges that fraud prevention models must deal with. In this work, we use a real Brazilian e-commerce databaset to compare different machine learning algorithms and study the online learning approach as an alternative to deal with concept drift. The experiments showed that the decision tree based algorithms performed better and the Gradient Boosting Decision Tree was the best. Moreover, the comparison of different learning strategies revealed that the online learning approach improved the algorithms performance in the presence of concept drift, reducing by up to 30% the losses with chargebacks. https://doi.org/10.11606/D.55.2023.tde-23082023-102023info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:59:22Zoai:teses.usp.br:tde-23082023-102023Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:12:15.416554Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.pt.fl_str_mv |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
dc.title.alternative.en.fl_str_mv |
Credit card fraud detection: a case study of supervised models in brazilian e-commerce |
title |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
spellingShingle |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro Rafael Belmiro Cristovão |
title_short |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
title_full |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
title_fullStr |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
title_full_unstemmed |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
title_sort |
Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro |
author |
Rafael Belmiro Cristovão |
author_facet |
Rafael Belmiro Cristovão |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Gustavo Carlos Buscaglia |
dc.contributor.referee1.fl_str_mv |
Diego Raphael Amancio |
dc.contributor.referee2.fl_str_mv |
Francisco Aparecido Rodrigues |
dc.contributor.referee3.fl_str_mv |
Gustavo Rocha da Silva |
dc.contributor.author.fl_str_mv |
Rafael Belmiro Cristovão |
contributor_str_mv |
Gustavo Carlos Buscaglia Diego Raphael Amancio Francisco Aparecido Rodrigues Gustavo Rocha da Silva |
description |
As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift. |
publishDate |
2023 |
dc.date.issued.fl_str_mv |
2023-03-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.11606/D.55.2023.tde-23082023-102023 |
url |
https://doi.org/10.11606/D.55.2023.tde-23082023-102023 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade de São Paulo |
dc.publisher.program.fl_str_mv |
Mestrado Profissional Matemática, Estatística e Computação Aplicadas à Indústria |
dc.publisher.initials.fl_str_mv |
USP |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade de São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1794503001214287872 |