Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning

Detalhes bibliográficos
Autor(a) principal: Soares, Pedro Francisco de Borges Castro de Rodrigues
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/23993
Resumo: O crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.
id RCAP_66a6ddaaade3c9e62b40175ece265792
oai_identifier_str oai:recipp.ipp.pt:10400.22/23993
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine LearningArtificial IntelligenceE-CommerceOnline FraudFraud DetectionMachine LearningDeep LearningClassification SystemsDomínio/Área Científica::Engenharia e TecnologiaO crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.The exponential growth of e-commerce has brought numerous advantages and opportunities by facilitating the lifestyle of human beings. However, it has also given rise to a serious problem: online fraud. With the purpose of solving this problem, this work addresses the imperative need to develop complex fraud detection systems within the scope of electronic commerce. After a systematic review of the literature, different techniques were identified and implemented that contributed to the improvement of existing projects, allowing for a more accurate comparative analysis. In this context, the RF, LR, SVM, KNN, DT, LSTM and CNN algorithms, as they are the most suitable for classification systems due to their versatility and ability to learn complex patterns in data, were applied to three distinct datasets. To rigorously evaluate the proposed models, the dataset was divided into 70% training data and the remaining 30% to testing data. Each of the datasets consists in specific characteristics, in order to evaluate the impact of oversampling and undersampling techniques. The algorithms were also applied to the same datasets with normalized data, to infer which models benefit from this normalization. The results demonstrated that the RF and CNN algorithms presented superior performance compared to the remaining algorithms tested. These algorithms were subsequently optimized by exploring the respective hyper-parameters, which allowed improving the model's performance and, in turn, achieving higher quality results. The use of artificial intelligence to detect fraud in e-commerce is essential to protect the interests of both companies and consumers. This work's main focus was to contribute to the advancement of fraudulent purchase detection systems by providing information about the positive and negative points of various machine learning algorithms in the context of the problem in question.Martins, António Constantino Lopes MartinsRepositório Científico do Instituto Politécnico do PortoSoares, Pedro Francisco de Borges Castro de Rodrigues2023-11-27T14:36:54Z2023-10-272023-10-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23993TID:203380924porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-29T01:48:12Zoai:recipp.ipp.pt:10400.22/23993Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:20:00.876764Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
spellingShingle Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
Soares, Pedro Francisco de Borges Castro de Rodrigues
Artificial Intelligence
E-Commerce
Online Fraud
Fraud Detection
Machine Learning
Deep Learning
Classification Systems
Domínio/Área Científica::Engenharia e Tecnologia
title_short Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_full Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_fullStr Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_full_unstemmed Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_sort Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
author Soares, Pedro Francisco de Borges Castro de Rodrigues
author_facet Soares, Pedro Francisco de Borges Castro de Rodrigues
author_role author
dc.contributor.none.fl_str_mv Martins, António Constantino Lopes Martins
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Soares, Pedro Francisco de Borges Castro de Rodrigues
dc.subject.por.fl_str_mv Artificial Intelligence
E-Commerce
Online Fraud
Fraud Detection
Machine Learning
Deep Learning
Classification Systems
Domínio/Área Científica::Engenharia e Tecnologia
topic Artificial Intelligence
E-Commerce
Online Fraud
Fraud Detection
Machine Learning
Deep Learning
Classification Systems
Domínio/Área Científica::Engenharia e Tecnologia
description O crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-27T14:36:54Z
2023-10-27
2023-10-27T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/23993
TID:203380924
url http://hdl.handle.net/10400.22/23993
identifier_str_mv TID:203380924
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135499154096128