Uma solução de processamento de transações de crédito para predição de fraudes

Detalhes bibliográficos
Autor(a) principal: Palha, Marcos André Künzel
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/262733
Resumo: Ao longo das últimas décadas, com o rápido crescimento dos negócios alavancados por canais da internet, houve um crescimento dramático do volume de fraudes, não apenas em números, mas também em formas e técnicas adotadas pelos fraudadores. Nesse mesmo período, evoluções tecnológicas significativas aconteceram, com uma crescente onda de técnicas relacionadas a inteligência artificial, big data e aprendizado de máquina. Estas abordagens inovadoras, para o contexto desse trabalho, são chamadas de “Técnicas Emergentes”, muitas delas oferecem subsídios importantes para o combate a fraudes em diversas áreas e formas. Inicialmente, neste trabalho, foi realizada uma revisão sistemá tica para mapear a contribuição efetiva das técnicas emergentes para combater fraudes, se comparada as abordagens de detecção de fraude clássicas. A partir da revisão sistemática, duas taxonomias foram propostas de forma a estruturar os trabalhos por tipos de fraude e categoria de técnica emergente utilizada na abordagem de detecção de fraude. Como um desdobramento da análise dos trabalhos levantados nessa pesquisa, este trabalho propõe uma solução para predição de fraudes em transações de crédito, baseada em aprendizado de máquina. Uma implementação dessa proposta é desenvolvida, descrita e experimentos são conduzidos utilizando três algoritmos distintos de aprendizado de máquina (RF, XGB e MLP). Estes algoritmos são alimentados com dados de uma base de transações de crédito real, sobre a qual quatro estudos de caso foram desenvolvidos, treinando e testando os três modelos com um mesmo conjunto de features e dados. Como parte dos resultados desses experimentos, os modelos são comparados entre si e com o sistema de regras de decisão atualmente utilizado pela empresa (baseline). Os resultados obtidos demonstram que os modelos de aprendizado de máquina são uma boa alternativa aos sistemas de detecção de fraude clássicos, melhorando métricas significativas como acurácia balanceada de 78,6% (MPBR) para 86,9% (MLP). Na comparação entre os modelos testados o MLP foi escolhido para prototipação devido as suas características simplificarem o retreino. Na análise dos resultados foi proposta também uma futura combinação dos modelos com o sistema de decisão, de forma a reduzir custo operacional tanto na atualização periódicas das regras do MPBR quanto no volume de transações que demandam uma revisão manual por parte da equipe de combate a fraudes.
id URGS_06940a65d2b83c2012f6d8f04555a327
oai_identifier_str oai:www.lume.ufrgs.br:10183/262733
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Palha, Marcos André KünzelGalante, Renata de Matos2023-07-28T03:36:41Z2023http://hdl.handle.net/10183/262733001174168Ao longo das últimas décadas, com o rápido crescimento dos negócios alavancados por canais da internet, houve um crescimento dramático do volume de fraudes, não apenas em números, mas também em formas e técnicas adotadas pelos fraudadores. Nesse mesmo período, evoluções tecnológicas significativas aconteceram, com uma crescente onda de técnicas relacionadas a inteligência artificial, big data e aprendizado de máquina. Estas abordagens inovadoras, para o contexto desse trabalho, são chamadas de “Técnicas Emergentes”, muitas delas oferecem subsídios importantes para o combate a fraudes em diversas áreas e formas. Inicialmente, neste trabalho, foi realizada uma revisão sistemá tica para mapear a contribuição efetiva das técnicas emergentes para combater fraudes, se comparada as abordagens de detecção de fraude clássicas. A partir da revisão sistemática, duas taxonomias foram propostas de forma a estruturar os trabalhos por tipos de fraude e categoria de técnica emergente utilizada na abordagem de detecção de fraude. Como um desdobramento da análise dos trabalhos levantados nessa pesquisa, este trabalho propõe uma solução para predição de fraudes em transações de crédito, baseada em aprendizado de máquina. Uma implementação dessa proposta é desenvolvida, descrita e experimentos são conduzidos utilizando três algoritmos distintos de aprendizado de máquina (RF, XGB e MLP). Estes algoritmos são alimentados com dados de uma base de transações de crédito real, sobre a qual quatro estudos de caso foram desenvolvidos, treinando e testando os três modelos com um mesmo conjunto de features e dados. Como parte dos resultados desses experimentos, os modelos são comparados entre si e com o sistema de regras de decisão atualmente utilizado pela empresa (baseline). Os resultados obtidos demonstram que os modelos de aprendizado de máquina são uma boa alternativa aos sistemas de detecção de fraude clássicos, melhorando métricas significativas como acurácia balanceada de 78,6% (MPBR) para 86,9% (MLP). Na comparação entre os modelos testados o MLP foi escolhido para prototipação devido as suas características simplificarem o retreino. Na análise dos resultados foi proposta também uma futura combinação dos modelos com o sistema de decisão, de forma a reduzir custo operacional tanto na atualização periódicas das regras do MPBR quanto no volume de transações que demandam uma revisão manual por parte da equipe de combate a fraudes.Over the last few decades, with the rapid growth of business leveraged by internet chan nels, there has been a dramatic increase in the volume of fraud, not only in numbers but also in the forms and techniques adopted by fraudsters. In this same period, significant technological developments have taken place, with a growing wave of techniques related to artificial intelligence, big data and machine learning. These innovative approaches, in the context of this work, are called “Emerging Techniques” many of which offer im portant subsidies for combating fraud in a variety of areas and forms. Initially, in this paper, a systematic review was conducted to map the effective contribution of emerging techniques to fight fraud compared to classical fraud detection approaches. From the sys tematic review, two taxonomies were proposed in order to structure the papers by types of fraud and category of emerging techniques used in the fraud detection approach. As a result of the analysis of the works surveyed in this research, this paper proposes a solution for predicting fraud in credit transactions, based on machine learning. An implementation of this proposal is developed, described, and experiments are conducted using three dis tinct machine learning algorithms (RF, XGB, and MLP). These algorithms are fed with data from a real credit transaction dataset, on which four experimental case studies were developed, training and testing the three models with the same set of features and data. As part of the results of these experiments, the models are compared with each other and with the decision rule system currently used by the company (baseline). The results obtained show that the machine learning models are a good alternative to classical fraud detection systems, improving significant metrics such as balanced accuracy from 78.6% (MPBR) to 86.9% (MLP). In the comparison between the tested models, MLP was chosen for pro totyping due to its features to simplify retraining. In the analysis of the results, it was also proposed a future combination of the models with the decision system, in order to reduce the operational costs both in the periodic renewal of the MPBR rules and in the volume of transactions that demand a manual review by the fraud ops team.application/pdfengDetecção de fraudeAlgoritmosAprendizado de máquinaInteligência artificialBig dataFraud detectionPrediction taskEmerging techniquesLearning systemsDecision systems based on score modelUma solução de processamento de transações de crédito para predição de fraudesA fraud prediction solution to process credit transactions info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001174168.pdf.txt001174168.pdf.txtExtracted Texttext/plain209844http://www.lume.ufrgs.br/bitstream/10183/262733/2/001174168.pdf.txt11e90d129fc143cd32ba1c242e8fbcf4MD52ORIGINAL001174168.pdfTexto completoapplication/pdf3542282http://www.lume.ufrgs.br/bitstream/10183/262733/1/001174168.pdf0e1ab44cce233c3fa27951494de71457MD5110183/2627332023-07-29 03:36:13.432869oai:www.lume.ufrgs.br:10183/262733Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-07-29T06:36:13Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Uma solução de processamento de transações de crédito para predição de fraudes
dc.title.alternative.pt.fl_str_mv A fraud prediction solution to process credit transactions
title Uma solução de processamento de transações de crédito para predição de fraudes
spellingShingle Uma solução de processamento de transações de crédito para predição de fraudes
Palha, Marcos André Künzel
Detecção de fraude
Algoritmos
Aprendizado de máquina
Inteligência artificial
Big data
Fraud detection
Prediction task
Emerging techniques
Learning systems
Decision systems based on score model
title_short Uma solução de processamento de transações de crédito para predição de fraudes
title_full Uma solução de processamento de transações de crédito para predição de fraudes
title_fullStr Uma solução de processamento de transações de crédito para predição de fraudes
title_full_unstemmed Uma solução de processamento de transações de crédito para predição de fraudes
title_sort Uma solução de processamento de transações de crédito para predição de fraudes
author Palha, Marcos André Künzel
author_facet Palha, Marcos André Künzel
author_role author
dc.contributor.author.fl_str_mv Palha, Marcos André Künzel
dc.contributor.advisor1.fl_str_mv Galante, Renata de Matos
contributor_str_mv Galante, Renata de Matos
dc.subject.por.fl_str_mv Detecção de fraude
Algoritmos
Aprendizado de máquina
Inteligência artificial
Big data
topic Detecção de fraude
Algoritmos
Aprendizado de máquina
Inteligência artificial
Big data
Fraud detection
Prediction task
Emerging techniques
Learning systems
Decision systems based on score model
dc.subject.eng.fl_str_mv Fraud detection
Prediction task
Emerging techniques
Learning systems
Decision systems based on score model
description Ao longo das últimas décadas, com o rápido crescimento dos negócios alavancados por canais da internet, houve um crescimento dramático do volume de fraudes, não apenas em números, mas também em formas e técnicas adotadas pelos fraudadores. Nesse mesmo período, evoluções tecnológicas significativas aconteceram, com uma crescente onda de técnicas relacionadas a inteligência artificial, big data e aprendizado de máquina. Estas abordagens inovadoras, para o contexto desse trabalho, são chamadas de “Técnicas Emergentes”, muitas delas oferecem subsídios importantes para o combate a fraudes em diversas áreas e formas. Inicialmente, neste trabalho, foi realizada uma revisão sistemá tica para mapear a contribuição efetiva das técnicas emergentes para combater fraudes, se comparada as abordagens de detecção de fraude clássicas. A partir da revisão sistemática, duas taxonomias foram propostas de forma a estruturar os trabalhos por tipos de fraude e categoria de técnica emergente utilizada na abordagem de detecção de fraude. Como um desdobramento da análise dos trabalhos levantados nessa pesquisa, este trabalho propõe uma solução para predição de fraudes em transações de crédito, baseada em aprendizado de máquina. Uma implementação dessa proposta é desenvolvida, descrita e experimentos são conduzidos utilizando três algoritmos distintos de aprendizado de máquina (RF, XGB e MLP). Estes algoritmos são alimentados com dados de uma base de transações de crédito real, sobre a qual quatro estudos de caso foram desenvolvidos, treinando e testando os três modelos com um mesmo conjunto de features e dados. Como parte dos resultados desses experimentos, os modelos são comparados entre si e com o sistema de regras de decisão atualmente utilizado pela empresa (baseline). Os resultados obtidos demonstram que os modelos de aprendizado de máquina são uma boa alternativa aos sistemas de detecção de fraude clássicos, melhorando métricas significativas como acurácia balanceada de 78,6% (MPBR) para 86,9% (MLP). Na comparação entre os modelos testados o MLP foi escolhido para prototipação devido as suas características simplificarem o retreino. Na análise dos resultados foi proposta também uma futura combinação dos modelos com o sistema de decisão, de forma a reduzir custo operacional tanto na atualização periódicas das regras do MPBR quanto no volume de transações que demandam uma revisão manual por parte da equipe de combate a fraudes.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-28T03:36:41Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/262733
dc.identifier.nrb.pt_BR.fl_str_mv 001174168
url http://hdl.handle.net/10183/262733
identifier_str_mv 001174168
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/262733/2/001174168.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/262733/1/001174168.pdf
bitstream.checksum.fl_str_mv 11e90d129fc143cd32ba1c242e8fbcf4
0e1ab44cce233c3fa27951494de71457
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309219956621312