Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro

Detalhes bibliográficos
Autor(a) principal: Rafael Belmiro Cristovão
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/D.55.2023.tde-23082023-102023
Resumo: As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.
id USP_569a653f81dc7ee4e28d3fb47189d1ba
oai_identifier_str oai:teses.usp.br:tde-23082023-102023
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro Credit card fraud detection: a case study of supervised models in brazilian e-commerce 2023-03-31Gustavo Carlos BuscagliaDiego Raphael AmancioFrancisco Aparecido RodriguesGustavo Rocha da SilvaRafael Belmiro CristovãoUniversidade de São PauloMestrado Profissional Matemática, Estatística e Computação Aplicadas à IndústriaUSPBR Cartão de crédito Compra online Credit card Detecção de fraude Ecommerce Ecommerce Fraud Fraud detection Fraude Online purchase As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift. Fraud has grown significantly with the development of new communication technologies and the processes digitalization, resulting in huge financial losses for institutions. Consequently, fraud detection and prevention methods are important topics to explore. Credit card fraud is one of the most frequent type of fraud due to the popularization of online shopping, ease of using third party credit cards and the lack of validation layers, such as password and chip verification, which are commonly used in face-to-face purchases. Many different techniques for extracting features and machine learning algorithms are used to create fraud prevention and detection models. The need to quickly adapt to new types of fraud, unbalanced distributions and the delay in obtaining information on fraudulent transactions are some of the challenges that fraud prevention models must deal with. In this work, we use a real Brazilian e-commerce databaset to compare different machine learning algorithms and study the online learning approach as an alternative to deal with concept drift. The experiments showed that the decision tree based algorithms performed better and the Gradient Boosting Decision Tree was the best. Moreover, the comparison of different learning strategies revealed that the online learning approach improved the algorithms performance in the presence of concept drift, reducing by up to 30% the losses with chargebacks. https://doi.org/10.11606/D.55.2023.tde-23082023-102023info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:59:22Zoai:teses.usp.br:tde-23082023-102023Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:12:15.416554Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
dc.title.alternative.en.fl_str_mv Credit card fraud detection: a case study of supervised models in brazilian e-commerce
title Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
spellingShingle Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
Rafael Belmiro Cristovão
title_short Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_fullStr Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full_unstemmed Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_sort Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
author Rafael Belmiro Cristovão
author_facet Rafael Belmiro Cristovão
author_role author
dc.contributor.advisor1.fl_str_mv Gustavo Carlos Buscaglia
dc.contributor.referee1.fl_str_mv Diego Raphael Amancio
dc.contributor.referee2.fl_str_mv Francisco Aparecido Rodrigues
dc.contributor.referee3.fl_str_mv Gustavo Rocha da Silva
dc.contributor.author.fl_str_mv Rafael Belmiro Cristovão
contributor_str_mv Gustavo Carlos Buscaglia
Diego Raphael Amancio
Francisco Aparecido Rodrigues
Gustavo Rocha da Silva
description As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.
publishDate 2023
dc.date.issued.fl_str_mv 2023-03-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/D.55.2023.tde-23082023-102023
url https://doi.org/10.11606/D.55.2023.tde-23082023-102023
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Mestrado Profissional Matemática, Estatística e Computação Aplicadas à Indústria
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794503001214287872