Applying Machine Learning to Detect Phishing URLs

Resnick, Noam Eyal; Bastos-Filho, Carmelo José Albanez

Applying Machine Learning to Detect Phishing URLs

Detalhes bibliográficos
Autor(a) principal:	Resnick, Noam Eyal
Data de Publicação:	2023
Outros Autores:	Bastos-Filho, Carmelo José Albanez
Tipo de documento:	Artigo
Idioma:	por
Título da fonte:	Revista de Engenharia e Pesquisa Aplicada
Texto Completo:	http://revistas.poli.br/index.php/repa/article/view/2773
Resumo:	Ataques de phishing são um dos ciberataques mais comuns e difíceis de mitigar de forma automatizada. Nos últimos anos, foram propostas uma série de técnicas de detecção e mitigação automatizadas com sucessos variados. Devido ao grande volume de phishing criado diariamente e um tempo de vida médio baixo, é necessária uma técnica de classificação de phishing que consiga atuar de forma rápida e automática. Nesse projeto, propõe-se utilizar técnicas de aprendizado de máquina para realizar essa classificação. Foram coletados mais de 50.000 urls, com mais de 20.000 pertencentes a páginas web que continham um ataque phishing. A partir dessas urls, foi construído um conjunto de dados contendo 15 atributos para o treinamento, validação e testes de modelos de inteligência computacional. Foi realizado um trabalho em três etapas: construção do conjunto de dados, treino de modelos de classificação, e avaliação do desempenho dos modelos treinados. Foram treinados modelos de classificação utilizando os algoritmos Random Forest, XGBoost e Rede Neural Artificial. As métricas utilizadas para avaliar o desempenho dos modelos foram acurácia, precisão e revocação. Os resultados experimentais mostraram o melhor desempenho do modelo de classificação utilizando Floresta Aleatória nas métricas de acurácia, precisão, revocação e F1 Score.

Metadados do item

id	UFPE-2_4d2cdb6729a27bdf677430aa5d0e18e6
oai_identifier_str	oai:ojs.poli.br:article/2773
network_acronym_str	UFPE-2
network_name_str	Revista de Engenharia e Pesquisa Aplicada
repository_id_str
spelling	Applying Machine Learning to Detect Phishing URLsAplicação de Aprendizado de Máquinas para Detecção de URLs PhishingAtaques de phishing são um dos ciberataques mais comuns e difíceis de mitigar de forma automatizada. Nos últimos anos, foram propostas uma série de técnicas de detecção e mitigação automatizadas com sucessos variados. Devido ao grande volume de phishing criado diariamente e um tempo de vida médio baixo, é necessária uma técnica de classificação de phishing que consiga atuar de forma rápida e automática. Nesse projeto, propõe-se utilizar técnicas de aprendizado de máquina para realizar essa classificação. Foram coletados mais de 50.000 urls, com mais de 20.000 pertencentes a páginas web que continham um ataque phishing. A partir dessas urls, foi construído um conjunto de dados contendo 15 atributos para o treinamento, validação e testes de modelos de inteligência computacional. Foi realizado um trabalho em três etapas: construção do conjunto de dados, treino de modelos de classificação, e avaliação do desempenho dos modelos treinados. Foram treinados modelos de classificação utilizando os algoritmos Random Forest, XGBoost e Rede Neural Artificial. As métricas utilizadas para avaliar o desempenho dos modelos foram acurácia, precisão e revocação. Os resultados experimentais mostraram o melhor desempenho do modelo de classificação utilizando Floresta Aleatória nas métricas de acurácia, precisão, revocação e F1 Score.Escola Politécnica de Pernambuco2023-12-28info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttp://revistas.poli.br/index.php/repa/article/view/277310.25286/repa.v9i1.2773Journal of Engineering and Applied Research; Vol 9 No 1 (2024): Edição Especial em Ciência de Dados e Analytics; 41-49Revista de Engenharia e Pesquisa Aplicada; v. 9 n. 1 (2024): Edição Especial em Ciência de Dados e Analytics; 41-492525-425110.25286/repa.v9i1reponame:Revista de Engenharia e Pesquisa Aplicadainstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEporhttp://revistas.poli.br/index.php/repa/article/view/2773/897http://revistas.poli.br/index.php/repa/article/view/2773/898Copyright (c) 2024 Noam Eyal Resnick, Carmelo José Albanez Bastos-Filhohttp://creativecommons.org/licenses/by-nc/4.0info:eu-repo/semantics/openAccessResnick, Noam EyalBastos-Filho, Carmelo José Albanez2023-12-30T10:15:41Zoai:ojs.poli.br:article/2773Revistahttp://revistas.poli.br/index.php/repaONGhttp://revistas.poli.br/index.php/repa/oai\|\|repa@poli.br2525-42512525-4251opendoar:2023-12-30T10:15:41Revista de Engenharia e Pesquisa Aplicada - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv	Applying Machine Learning to Detect Phishing URLs Aplicação de Aprendizado de Máquinas para Detecção de URLs Phishing
title	Applying Machine Learning to Detect Phishing URLs
spellingShingle	Applying Machine Learning to Detect Phishing URLs Resnick, Noam Eyal
title_short	Applying Machine Learning to Detect Phishing URLs
title_full	Applying Machine Learning to Detect Phishing URLs
title_fullStr	Applying Machine Learning to Detect Phishing URLs
title_full_unstemmed	Applying Machine Learning to Detect Phishing URLs
title_sort	Applying Machine Learning to Detect Phishing URLs
author	Resnick, Noam Eyal
author_facet	Resnick, Noam Eyal Bastos-Filho, Carmelo José Albanez
author_role	author
author2	Bastos-Filho, Carmelo José Albanez
author2_role	author
dc.contributor.author.fl_str_mv	Resnick, Noam Eyal Bastos-Filho, Carmelo José Albanez
description	Ataques de phishing são um dos ciberataques mais comuns e difíceis de mitigar de forma automatizada. Nos últimos anos, foram propostas uma série de técnicas de detecção e mitigação automatizadas com sucessos variados. Devido ao grande volume de phishing criado diariamente e um tempo de vida médio baixo, é necessária uma técnica de classificação de phishing que consiga atuar de forma rápida e automática. Nesse projeto, propõe-se utilizar técnicas de aprendizado de máquina para realizar essa classificação. Foram coletados mais de 50.000 urls, com mais de 20.000 pertencentes a páginas web que continham um ataque phishing. A partir dessas urls, foi construído um conjunto de dados contendo 15 atributos para o treinamento, validação e testes de modelos de inteligência computacional. Foi realizado um trabalho em três etapas: construção do conjunto de dados, treino de modelos de classificação, e avaliação do desempenho dos modelos treinados. Foram treinados modelos de classificação utilizando os algoritmos Random Forest, XGBoost e Rede Neural Artificial. As métricas utilizadas para avaliar o desempenho dos modelos foram acurácia, precisão e revocação. Os resultados experimentais mostraram o melhor desempenho do modelo de classificação utilizando Floresta Aleatória nas métricas de acurácia, precisão, revocação e F1 Score.
publishDate	2023
dc.date.none.fl_str_mv	2023-12-28
dc.type.driver.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion
format	article
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://revistas.poli.br/index.php/repa/article/view/2773 10.25286/repa.v9i1.2773
url	http://revistas.poli.br/index.php/repa/article/view/2773
identifier_str_mv	10.25286/repa.v9i1.2773
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	http://revistas.poli.br/index.php/repa/article/view/2773/897 http://revistas.poli.br/index.php/repa/article/view/2773/898
dc.rights.driver.fl_str_mv	Copyright (c) 2024 Noam Eyal Resnick, Carmelo José Albanez Bastos-Filho http://creativecommons.org/licenses/by-nc/4.0 info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Copyright (c) 2024 Noam Eyal Resnick, Carmelo José Albanez Bastos-Filho http://creativecommons.org/licenses/by-nc/4.0
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf text/html
dc.publisher.none.fl_str_mv	Escola Politécnica de Pernambuco
publisher.none.fl_str_mv	Escola Politécnica de Pernambuco
dc.source.none.fl_str_mv	Journal of Engineering and Applied Research; Vol 9 No 1 (2024): Edição Especial em Ciência de Dados e Analytics; 41-49 Revista de Engenharia e Pesquisa Aplicada; v. 9 n. 1 (2024): Edição Especial em Ciência de Dados e Analytics; 41-49 2525-4251 10.25286/repa.v9i1 reponame:Revista de Engenharia e Pesquisa Aplicada instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE
instname_str	Universidade Federal de Pernambuco (UFPE)
instacron_str	UFPE
institution	UFPE
reponame_str	Revista de Engenharia e Pesquisa Aplicada
collection	Revista de Engenharia e Pesquisa Aplicada
repository.name.fl_str_mv	Revista de Engenharia e Pesquisa Aplicada - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv	\|\|repa@poli.br
_version_	1798036000521322496

Applying Machine Learning to Detect Phishing URLs

Registros relacionados