Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning

Soares, Pedro Francisco de Borges Castro de Rodrigues

Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning

Detalhes bibliográficos
Autor(a) principal:	Soares, Pedro Francisco de Borges Castro de Rodrigues
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10400.22/23993
Resumo:	O crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.

Metadados do item

id	RCAP_66a6ddaaade3c9e62b40175ece265792
oai_identifier_str	oai:recipp.ipp.pt:10400.22/23993
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine LearningArtificial IntelligenceE-CommerceOnline FraudFraud DetectionMachine LearningDeep LearningClassification SystemsDomínio/Área Científica::Engenharia e TecnologiaO crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.The exponential growth of e-commerce has brought numerous advantages and opportunities by facilitating the lifestyle of human beings. However, it has also given rise to a serious problem: online fraud. With the purpose of solving this problem, this work addresses the imperative need to develop complex fraud detection systems within the scope of electronic commerce. After a systematic review of the literature, different techniques were identified and implemented that contributed to the improvement of existing projects, allowing for a more accurate comparative analysis. In this context, the RF, LR, SVM, KNN, DT, LSTM and CNN algorithms, as they are the most suitable for classification systems due to their versatility and ability to learn complex patterns in data, were applied to three distinct datasets. To rigorously evaluate the proposed models, the dataset was divided into 70% training data and the remaining 30% to testing data. Each of the datasets consists in specific characteristics, in order to evaluate the impact of oversampling and undersampling techniques. The algorithms were also applied to the same datasets with normalized data, to infer which models benefit from this normalization. The results demonstrated that the RF and CNN algorithms presented superior performance compared to the remaining algorithms tested. These algorithms were subsequently optimized by exploring the respective hyper-parameters, which allowed improving the model's performance and, in turn, achieving higher quality results. The use of artificial intelligence to detect fraud in e-commerce is essential to protect the interests of both companies and consumers. This work's main focus was to contribute to the advancement of fraudulent purchase detection systems by providing information about the positive and negative points of various machine learning algorithms in the context of the problem in question.Martins, António Constantino Lopes MartinsRepositório Científico do Instituto Politécnico do PortoSoares, Pedro Francisco de Borges Castro de Rodrigues2023-11-27T14:36:54Z2023-10-272023-10-27T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23993TID:203380924porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-29T01:48:12Zoai:recipp.ipp.pt:10400.22/23993Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:20:00.876764Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
spellingShingle	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning Soares, Pedro Francisco de Borges Castro de Rodrigues Artificial Intelligence E-Commerce Online Fraud Fraud Detection Machine Learning Deep Learning Classification Systems Domínio/Área Científica::Engenharia e Tecnologia
title_short	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_full	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_fullStr	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_full_unstemmed	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
title_sort	Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning
author	Soares, Pedro Francisco de Borges Castro de Rodrigues
author_facet	Soares, Pedro Francisco de Borges Castro de Rodrigues
author_role	author
dc.contributor.none.fl_str_mv	Martins, António Constantino Lopes Martins Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv	Soares, Pedro Francisco de Borges Castro de Rodrigues
dc.subject.por.fl_str_mv	Artificial Intelligence E-Commerce Online Fraud Fraud Detection Machine Learning Deep Learning Classification Systems Domínio/Área Científica::Engenharia e Tecnologia
topic	Artificial Intelligence E-Commerce Online Fraud Fraud Detection Machine Learning Deep Learning Classification Systems Domínio/Área Científica::Engenharia e Tecnologia
description	O crescimento exponencial do comércio eletrónico trouxe inúmeras vantagens e oportunidades ao facilitar o estilo de vida dos seres humanos. No entanto, deu também origem a um grave problema: a fraude online. Com o propósito de colmatar este problema, este trabalho aborda a necessidade de desenvolver sistemas de deteção de fraude complexos no âmbito do comércio eletrónico. Após uma revisão abrangente da literatura, foram identificadas e implementadas técnicas que contribuíram para a melhoria dos projetos existentes, permitindo uma análise comparativa mais precisa. Neste contexto, os algoritmos de RF, LR, SVM, KNN, DT, LSTM e CNN, por serem os mais adequados a sistemas de classificação pela sua versatilidade e capacidade de aprender padrões complexos nos dados, foram aplicados a três conjuntos de dados distintos. Para avaliar rigorosamente os modelos propostos, o conjunto de dados foi dividido em 70% de dados para treino e os restantes 30% para teste. Cada um dos conjuntos de dados apresenta características específicas, de forma a avaliar o impacto de técnicas de oversampling e undersampling. Os algoritmos foram aplicados também aos mesmos conjuntos com os dados normalizados, para inferir quais os modelos que beneficiam desta normalização. Os resultados demonstraram que os modelos RF e CNN apresentaram um desempenho superior em comparação com os restantes algoritmos testados. Estes algoritmos foram posteriormente otimizados com a exploração dos hiper-parâmetros respetivos, o que permitiu melhorar o desempenho do modelo e, por sua vez, alcançar resultados de maior qualidade. A utilização de inteligência artificial na deteção de fraude no comércio eletrónico é fundamental para proteger os interesses tanto das empresas como dos consumidores. Este trabalho teve como foco principal contribuir para o avanço dos sistemas de deteção de transações fraudulentas ao fornecer informações sobre pontos positivos e negativos de vários algoritmos de machine learning no contexto do problema em questão.
publishDate	2023
dc.date.none.fl_str_mv	2023-11-27T14:36:54Z 2023-10-27 2023-10-27T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10400.22/23993 TID:203380924
url	http://hdl.handle.net/10400.22/23993
identifier_str_mv	TID:203380924
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799135499154096128

Sistema de Deteção de Transações Fraudulentas no e-commerce através de Machine Learning

Registros relacionados