Do tweet à ameaça:
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Outros Autores: | , , |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da FEI |
Texto Completo: | https://repositorio.fei.edu.br/handle/FEI/5284 |
Resumo: | Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline. |
id |
FEI_1d0cc422f2a2c15caf7b70ba100e9a72 |
---|---|
oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/5284 |
network_acronym_str |
FEI |
network_name_str |
Biblioteca Digital de Teses e Dissertações da FEI |
repository_id_str |
https://repositorio.fei.edu.br/oai/request |
spelling |
Do tweet à ameaça:um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem naturalsegurança cibernéticaataques cibernéticosredes sociaismachine learningprocessamento de textorastreamento de dadosanálise de sentimentoscybersecuritycyber attackssocial networksmachine learningtext processingdata trackingsentiment analysisCom o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.With the increase in cyber attacks, digital security becomes crucial. Social networks, especially Twitter, are platforms where hackers express their intentions. This work proposes a method for extracting and analyzing data from these networks using Machine Learning techniques and text preprocessing to identify patterns indicative of cyber threats. In the face of this challenge, two approaches are presented: the first combines sentiment analysis, entity recognition, and similarity with information security keywords into a single vector representation, along with the results of a classification algorithm. The second approach uses a weighted score for each attribute of the analysis mechanism, aiming for a more refined approach in detecting potential threats. The results highlight the importance of entity analysis in improving the model's accuracy, where it was found that dates and numbers are more prevalent in communications containing threats. Moreover, the obtained results challenge the effectiveness of sentiment analysis as a reliable indicator, defying the premise that sentiment polarity is a sure sign of malicious content in the identification of potentially dangerous tweets. In this scenario, the Random Forest algorithm stood out, achieving an accuracy of up to 79.59% in classifying tweets as threats, compared to a 79.25% baseline.Ferreira, Charles Henrique Portohttp://lattes.cnpq.br/9346953261085205Oliveira, Hugo LinharesCezarino, João Pedro RosaLacerda, Thales de OliveiraOliveira, Vitor Martins2024-02-28T12:00:17Z2024-02-28T12:00:17Z2023-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis49application/pdfapplication/pdfhttps://repositorio.fei.edu.br/handle/FEI/5284info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEI2024-03-01T03:00:24Zoai:repositorio.fei.edu.br:FEI/5284Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T03:00:24Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
dc.title.none.fl_str_mv |
Do tweet à ameaça: um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem natural |
title |
Do tweet à ameaça: |
spellingShingle |
Do tweet à ameaça: Oliveira, Hugo Linhares segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis |
title_short |
Do tweet à ameaça: |
title_full |
Do tweet à ameaça: |
title_fullStr |
Do tweet à ameaça: |
title_full_unstemmed |
Do tweet à ameaça: |
title_sort |
Do tweet à ameaça: |
author |
Oliveira, Hugo Linhares |
author_facet |
Oliveira, Hugo Linhares Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins |
author_role |
author |
author2 |
Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins |
author2_role |
author author author |
dc.contributor.none.fl_str_mv |
Ferreira, Charles Henrique Porto http://lattes.cnpq.br/9346953261085205 |
dc.contributor.author.fl_str_mv |
Oliveira, Hugo Linhares Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins |
dc.subject.por.fl_str_mv |
segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis |
topic |
segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis |
description |
Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12-05 2024-02-28T12:00:17Z 2024-02-28T12:00:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.fei.edu.br/handle/FEI/5284 |
url |
https://repositorio.fei.edu.br/handle/FEI/5284 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
49 application/pdf application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
instacron_str |
FEI |
institution |
FEI |
reponame_str |
Biblioteca Digital de Teses e Dissertações da FEI |
collection |
Biblioteca Digital de Teses e Dissertações da FEI |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI) |
repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
_version_ |
1809225180674785280 |