Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas

Detalhes bibliográficos
Autor(a) principal: Rafael Alexandre França de Lima
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-ACXKTA
Resumo: Uma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalanceamento entre as classes gera um novo desafio para realização dessa tarefa. Assim, neste trabalho analisamos estratégias de seleção de atributos para detecção de anomalias. A primeira abordagem realizada consiste na aplicação de 7 métodos de resampling, incluindo um criado neste trabalho, para reduzir o desbalanceamento antes da seleção. A segunda abordagem consiste na avaliação de 8 métodos de seleção de atributos considerados insensíveis ao desbalanceamento entre as classes, além da criação de um método para combinação das métricas. A validação sobre a eficácia dos métodos foi realizada construindo modelos de detecção de fraude, formados por 3 diferentes técnicas de classificação sobre os atributos selecionados pelas distintas abordagens. Para validação desses modelos, realizamos estudos de casos com dados reais, para detecção de fraudes em 2 populares sistemas de pagamentos eletrônico.
id UFMG_b64f6195ffd467e9110c73e1873e02d7
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-ACXKTA
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Adriano César Machado PereiraAnisio Mendes LacerdaGisele Lobo PappaWagner Meira JuniorRafael Alexandre França de Lima2019-08-14T19:33:31Z2019-08-14T19:33:31Z2016-06-15http://hdl.handle.net/1843/ESBF-ACXKTAUma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalanceamento entre as classes gera um novo desafio para realização dessa tarefa. Assim, neste trabalho analisamos estratégias de seleção de atributos para detecção de anomalias. A primeira abordagem realizada consiste na aplicação de 7 métodos de resampling, incluindo um criado neste trabalho, para reduzir o desbalanceamento antes da seleção. A segunda abordagem consiste na avaliação de 8 métodos de seleção de atributos considerados insensíveis ao desbalanceamento entre as classes, além da criação de um método para combinação das métricas. A validação sobre a eficácia dos métodos foi realizada construindo modelos de detecção de fraude, formados por 3 diferentes técnicas de classificação sobre os atributos selecionados pelas distintas abordagens. Para validação desses modelos, realizamos estudos de casos com dados reais, para detecção de fraudes em 2 populares sistemas de pagamentos eletrônico.Anomaly detection refers to the problem of finding patterns in data that deviates from the expected average behavior. One of the classic scenarios in this area is fraud detection, which consist in learn a fraudulent behavior from a set of observations. In electronic transactions, there is a large amount of information that could be used to detect fraud. Thus, filter this information and choose the most representative of it is a crucial task, known as Feature Selection. The best Feature Selection methods uses the class information to perform this task. However, an important characteristic in fraud detection problems is the high imbalance between the classes. This behavior generates a new challenge to Feature Selection techniques, which tend to select features in favor of the dominant class. Therefore, in this work we analyzed feature selection strategies to anomaly detection in electronic transactions. These strategies were divided in two distinct approaches. In the first approach we applied 7 resampling methods, including one created in this work, to reduce the imbalance between classes before feature selection step. In the second approach we evaluated 8 feature feature selection methods, considered insensitive to imbalance between the classes and we also create a method that uses the concept of Pareto Frontier to combine metrics. The validation of the effectiveness of the methods was performed building fraud detection models. This was performed applying 3 different classification techniques on the attributes selected by different approaches. To validate these models we performed case studies to fraud detection in 2 real dataset from electronic payment systems. We evaluate these models by 3 different metrics. Trough this experiments, we validate our research hypothesis, providing contributions to feature selection area in order to detect fraud. The best models achieved economic gains of up to 57% compared to the actual scenario of thecompany.Universidade Federal de Minas GeraisUFMGFraude na InternetDetecção de anomalias (Computação)ComputaçãoMineração de dados (Computação)Detecção de AnomaliasMineração de DadosSeleção de AtributosDetecção de FraudeEstratégias de seleção de atributos para detecção de anomalias em transações eletrônicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALrafaelfrancalima.pdfapplication/pdf3434429https://repositorio.ufmg.br/bitstream/1843/ESBF-ACXKTA/1/rafaelfrancalima.pdf8a26a1aad95183759b68dadbfeaa8bd3MD51TEXTrafaelfrancalima.pdf.txtrafaelfrancalima.pdf.txtExtracted texttext/plain211776https://repositorio.ufmg.br/bitstream/1843/ESBF-ACXKTA/2/rafaelfrancalima.pdf.txtd48bda72e1735ca179c3e49602eb1fa5MD521843/ESBF-ACXKTA2019-11-14 12:06:23.41oai:repositorio.ufmg.br:1843/ESBF-ACXKTARepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T15:06:23Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
title Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
spellingShingle Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
Rafael Alexandre França de Lima
Detecção de Anomalias
Mineração de Dados
Seleção de Atributos
Detecção de Fraude
Fraude na Internet
Detecção de anomalias (Computação)
Computação
Mineração de dados (Computação)
title_short Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
title_full Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
title_fullStr Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
title_full_unstemmed Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
title_sort Estratégias de seleção de atributos para detecção de anomalias em transações eletrônicas
author Rafael Alexandre França de Lima
author_facet Rafael Alexandre França de Lima
author_role author
dc.contributor.advisor1.fl_str_mv Adriano César Machado Pereira
dc.contributor.referee1.fl_str_mv Anisio Mendes Lacerda
dc.contributor.referee2.fl_str_mv Gisele Lobo Pappa
dc.contributor.referee3.fl_str_mv Wagner Meira Junior
dc.contributor.author.fl_str_mv Rafael Alexandre França de Lima
contributor_str_mv Adriano César Machado Pereira
Anisio Mendes Lacerda
Gisele Lobo Pappa
Wagner Meira Junior
dc.subject.por.fl_str_mv Detecção de Anomalias
Mineração de Dados
Seleção de Atributos
Detecção de Fraude
topic Detecção de Anomalias
Mineração de Dados
Seleção de Atributos
Detecção de Fraude
Fraude na Internet
Detecção de anomalias (Computação)
Computação
Mineração de dados (Computação)
dc.subject.other.pt_BR.fl_str_mv Fraude na Internet
Detecção de anomalias (Computação)
Computação
Mineração de dados (Computação)
description Uma tarefa crucial em detecção de anomalias é a seleção de atributos. Entretanto, o alto desbalanceamento entre as classes gera um novo desafio para realização dessa tarefa. Assim, neste trabalho analisamos estratégias de seleção de atributos para detecção de anomalias. A primeira abordagem realizada consiste na aplicação de 7 métodos de resampling, incluindo um criado neste trabalho, para reduzir o desbalanceamento antes da seleção. A segunda abordagem consiste na avaliação de 8 métodos de seleção de atributos considerados insensíveis ao desbalanceamento entre as classes, além da criação de um método para combinação das métricas. A validação sobre a eficácia dos métodos foi realizada construindo modelos de detecção de fraude, formados por 3 diferentes técnicas de classificação sobre os atributos selecionados pelas distintas abordagens. Para validação desses modelos, realizamos estudos de casos com dados reais, para detecção de fraudes em 2 populares sistemas de pagamentos eletrônico.
publishDate 2016
dc.date.issued.fl_str_mv 2016-06-15
dc.date.accessioned.fl_str_mv 2019-08-14T19:33:31Z
dc.date.available.fl_str_mv 2019-08-14T19:33:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-ACXKTA
url http://hdl.handle.net/1843/ESBF-ACXKTA
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-ACXKTA/1/rafaelfrancalima.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-ACXKTA/2/rafaelfrancalima.pdf.txt
bitstream.checksum.fl_str_mv 8a26a1aad95183759b68dadbfeaa8bd3
d48bda72e1735ca179c3e49602eb1fa5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589578535206912