Detecção de páginas de phishing utilizando aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/239096 |
Resumo: | Com o avanço da Internet e o aumento de serviços digitais, tentativas de fraudes online, como o phishing, se tornaram um problema cada vez maior. Devido ao contínuo aumento e evolução desses ataques, há a necessidade do desenvolvimento e aprimoramento de métodos para detecção deles. Neste trabalho, foi criado um sistema de detecção de páginas de phishing, utilizando técnicas de aprendizado de máquina como Árvore de Decisão, Floresta Aleatória, Árvores Extremamente Aleatórias e XGBoost. Os modelos foram desenvolvidos com um conjunto de dados de 88.647 entradas e mediu-se suas efetividades através de métricas já estabelecidas na área de aprendizado de máquina. Os resultados obtidos foram promissores, com o modelo XGBoost apresentando o melhor resultado, mostrando-se eficaz para a detecção de páginas da internet falsas. |
id |
UNSP_1cdc7c01c7a7b658e68b812dc9906082 |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/239096 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Detecção de páginas de phishing utilizando aprendizado de máquinaDetection of phishing pages using machine learning.Aprendizado de máquinaInteligência ArtificialFraude na InternetÁrvores de decisãoMachine learningArtificial intelligenceInternet fraudDecision treesCom o avanço da Internet e o aumento de serviços digitais, tentativas de fraudes online, como o phishing, se tornaram um problema cada vez maior. Devido ao contínuo aumento e evolução desses ataques, há a necessidade do desenvolvimento e aprimoramento de métodos para detecção deles. Neste trabalho, foi criado um sistema de detecção de páginas de phishing, utilizando técnicas de aprendizado de máquina como Árvore de Decisão, Floresta Aleatória, Árvores Extremamente Aleatórias e XGBoost. Os modelos foram desenvolvidos com um conjunto de dados de 88.647 entradas e mediu-se suas efetividades através de métricas já estabelecidas na área de aprendizado de máquina. Os resultados obtidos foram promissores, com o modelo XGBoost apresentando o melhor resultado, mostrando-se eficaz para a detecção de páginas da internet falsas.With the advancement of the Internet and increase use of digital services, online fraud attempts, like phishing, has become an even bigger problem. Because of the ongoing increase and evolution of these attacks, there's a need to develop and improve the methods used to detect them. In this work, a system for detection of phishing pages was developed using machine learning techniques such as Decision Tree, Random Forest, Extremely Randomized Trees and XGBoost. The models were developed using a dataset with 88,647 entries and their effectiveness was measured using metrics already established in the machine learning field. The results were promising, with the XGBoost model presenting the best result, showing to be effective in detecting fake internet pages.Não recebi financiamentoUniversidade Estadual Paulista (Unesp)Costa, Kelton Augusto Pontara da [UNESP]Universidade Estadual Paulista (Unesp)Coutinho, Vinicius Machado2023-01-30T11:36:28Z2023-01-30T11:36:28Z2023-01-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttp://hdl.handle.net/11449/239096porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-10-07T06:04:08Zoai:repositorio.unesp.br:11449/239096Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T14:14:15.130092Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Detecção de páginas de phishing utilizando aprendizado de máquina Detection of phishing pages using machine learning. |
title |
Detecção de páginas de phishing utilizando aprendizado de máquina |
spellingShingle |
Detecção de páginas de phishing utilizando aprendizado de máquina Coutinho, Vinicius Machado Aprendizado de máquina Inteligência Artificial Fraude na Internet Árvores de decisão Machine learning Artificial intelligence Internet fraud Decision trees |
title_short |
Detecção de páginas de phishing utilizando aprendizado de máquina |
title_full |
Detecção de páginas de phishing utilizando aprendizado de máquina |
title_fullStr |
Detecção de páginas de phishing utilizando aprendizado de máquina |
title_full_unstemmed |
Detecção de páginas de phishing utilizando aprendizado de máquina |
title_sort |
Detecção de páginas de phishing utilizando aprendizado de máquina |
author |
Coutinho, Vinicius Machado |
author_facet |
Coutinho, Vinicius Machado |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, Kelton Augusto Pontara da [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Coutinho, Vinicius Machado |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Inteligência Artificial Fraude na Internet Árvores de decisão Machine learning Artificial intelligence Internet fraud Decision trees |
topic |
Aprendizado de máquina Inteligência Artificial Fraude na Internet Árvores de decisão Machine learning Artificial intelligence Internet fraud Decision trees |
description |
Com o avanço da Internet e o aumento de serviços digitais, tentativas de fraudes online, como o phishing, se tornaram um problema cada vez maior. Devido ao contínuo aumento e evolução desses ataques, há a necessidade do desenvolvimento e aprimoramento de métodos para detecção deles. Neste trabalho, foi criado um sistema de detecção de páginas de phishing, utilizando técnicas de aprendizado de máquina como Árvore de Decisão, Floresta Aleatória, Árvores Extremamente Aleatórias e XGBoost. Os modelos foram desenvolvidos com um conjunto de dados de 88.647 entradas e mediu-se suas efetividades através de métricas já estabelecidas na área de aprendizado de máquina. Os resultados obtidos foram promissores, com o modelo XGBoost apresentando o melhor resultado, mostrando-se eficaz para a detecção de páginas da internet falsas. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-01-30T11:36:28Z 2023-01-30T11:36:28Z 2023-01-18 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/239096 |
url |
http://hdl.handle.net/11449/239096 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808128334307000320 |