Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro

Rafael Belmiro Cristovão

Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro

Detalhes bibliográficos
Autor(a) principal:	Rafael Belmiro Cristovão
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://doi.org/10.11606/D.55.2023.tde-23082023-102023
Resumo:	As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.

Metadados do item

id	USP_569a653f81dc7ee4e28d3fb47189d1ba
oai_identifier_str	oai:teses.usp.br:tde-23082023-102023
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro Credit card fraud detection: a case study of supervised models in brazilian e-commerce 2023-03-31Gustavo Carlos BuscagliaDiego Raphael AmancioFrancisco Aparecido RodriguesGustavo Rocha da SilvaRafael Belmiro CristovãoUniversidade de São PauloMestrado Profissional Matemática, Estatística e Computação Aplicadas à IndústriaUSPBR Cartão de crédito Compra online Credit card Detecção de fraude Ecommerce Ecommerce Fraud Fraud detection Fraude Online purchase As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift. Fraud has grown significantly with the development of new communication technologies and the processes digitalization, resulting in huge financial losses for institutions. Consequently, fraud detection and prevention methods are important topics to explore. Credit card fraud is one of the most frequent type of fraud due to the popularization of online shopping, ease of using third party credit cards and the lack of validation layers, such as password and chip verification, which are commonly used in face-to-face purchases. Many different techniques for extracting features and machine learning algorithms are used to create fraud prevention and detection models. The need to quickly adapt to new types of fraud, unbalanced distributions and the delay in obtaining information on fraudulent transactions are some of the challenges that fraud prevention models must deal with. In this work, we use a real Brazilian e-commerce databaset to compare different machine learning algorithms and study the online learning approach as an alternative to deal with concept drift. The experiments showed that the decision tree based algorithms performed better and the Gradient Boosting Decision Tree was the best. Moreover, the comparison of different learning strategies revealed that the online learning approach improved the algorithms performance in the presence of concept drift, reducing by up to 30% the losses with chargebacks. https://doi.org/10.11606/D.55.2023.tde-23082023-102023info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:59:22Zoai:teses.usp.br:tde-23082023-102023Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212023-12-22T13:12:15.416554Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
dc.title.alternative.en.fl_str_mv	Credit card fraud detection: a case study of supervised models in brazilian e-commerce
title	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
spellingShingle	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro Rafael Belmiro Cristovão
title_short	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_fullStr	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full_unstemmed	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_sort	Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
author	Rafael Belmiro Cristovão
author_facet	Rafael Belmiro Cristovão
author_role	author
dc.contributor.advisor1.fl_str_mv	Gustavo Carlos Buscaglia
dc.contributor.referee1.fl_str_mv	Diego Raphael Amancio
dc.contributor.referee2.fl_str_mv	Francisco Aparecido Rodrigues
dc.contributor.referee3.fl_str_mv	Gustavo Rocha da Silva
dc.contributor.author.fl_str_mv	Rafael Belmiro Cristovão
contributor_str_mv	Gustavo Carlos Buscaglia Diego Raphael Amancio Francisco Aparecido Rodrigues Gustavo Rocha da Silva
description	As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.
publishDate	2023
dc.date.issued.fl_str_mv	2023-03-31
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://doi.org/10.11606/D.55.2023.tde-23082023-102023
url	https://doi.org/10.11606/D.55.2023.tde-23082023-102023
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade de São Paulo
dc.publisher.program.fl_str_mv	Mestrado Profissional Matemática, Estatística e Computação Aplicadas à Indústria
dc.publisher.initials.fl_str_mv	USP
dc.publisher.country.fl_str_mv	BR
publisher.none.fl_str_mv	Universidade de São Paulo
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1794503001214287872

Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro

Registros relacionados