Do tweet à ameaça:

Detalhes bibliográficos
Autor(a) principal: Oliveira, Hugo Linhares
Data de Publicação: 2023
Outros Autores: Cezarino, João Pedro Rosa, Lacerda, Thales de Oliveira, Oliveira, Vitor Martins
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo: https://repositorio.fei.edu.br/handle/FEI/5284
Resumo: Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.
id FEI_1d0cc422f2a2c15caf7b70ba100e9a72
oai_identifier_str oai:repositorio.fei.edu.br:FEI/5284
network_acronym_str FEI
network_name_str Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str https://repositorio.fei.edu.br/oai/request
spelling Do tweet à ameaça:um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem naturalsegurança cibernéticaataques cibernéticosredes sociaismachine learningprocessamento de textorastreamento de dadosanálise de sentimentoscybersecuritycyber attackssocial networksmachine learningtext processingdata trackingsentiment analysisCom o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.With the increase in cyber attacks, digital security becomes crucial. Social networks, especially Twitter, are platforms where hackers express their intentions. This work proposes a method for extracting and analyzing data from these networks using Machine Learning techniques and text preprocessing to identify patterns indicative of cyber threats. In the face of this challenge, two approaches are presented: the first combines sentiment analysis, entity recognition, and similarity with information security keywords into a single vector representation, along with the results of a classification algorithm. The second approach uses a weighted score for each attribute of the analysis mechanism, aiming for a more refined approach in detecting potential threats. The results highlight the importance of entity analysis in improving the model's accuracy, where it was found that dates and numbers are more prevalent in communications containing threats. Moreover, the obtained results challenge the effectiveness of sentiment analysis as a reliable indicator, defying the premise that sentiment polarity is a sure sign of malicious content in the identification of potentially dangerous tweets. In this scenario, the Random Forest algorithm stood out, achieving an accuracy of up to 79.59% in classifying tweets as threats, compared to a 79.25% baseline.Ferreira, Charles Henrique Portohttp://lattes.cnpq.br/9346953261085205Oliveira, Hugo LinharesCezarino, João Pedro RosaLacerda, Thales de OliveiraOliveira, Vitor Martins2024-02-28T12:00:17Z2024-02-28T12:00:17Z2023-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis49application/pdfapplication/pdfhttps://repositorio.fei.edu.br/handle/FEI/5284info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEI2024-03-01T03:00:24Zoai:repositorio.fei.edu.br:FEI/5284Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T03:00:24Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv Do tweet à ameaça:
um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem natural
title Do tweet à ameaça:
spellingShingle Do tweet à ameaça:
Oliveira, Hugo Linhares
segurança cibernética
ataques cibernéticos
redes sociais
machine learning
processamento de texto
rastreamento de dados
análise de sentimentos
cybersecurity
cyber attacks
social networks
machine learning
text processing
data tracking
sentiment analysis
title_short Do tweet à ameaça:
title_full Do tweet à ameaça:
title_fullStr Do tweet à ameaça:
title_full_unstemmed Do tweet à ameaça:
title_sort Do tweet à ameaça:
author Oliveira, Hugo Linhares
author_facet Oliveira, Hugo Linhares
Cezarino, João Pedro Rosa
Lacerda, Thales de Oliveira
Oliveira, Vitor Martins
author_role author
author2 Cezarino, João Pedro Rosa
Lacerda, Thales de Oliveira
Oliveira, Vitor Martins
author2_role author
author
author
dc.contributor.none.fl_str_mv Ferreira, Charles Henrique Porto
http://lattes.cnpq.br/9346953261085205
dc.contributor.author.fl_str_mv Oliveira, Hugo Linhares
Cezarino, João Pedro Rosa
Lacerda, Thales de Oliveira
Oliveira, Vitor Martins
dc.subject.por.fl_str_mv segurança cibernética
ataques cibernéticos
redes sociais
machine learning
processamento de texto
rastreamento de dados
análise de sentimentos
cybersecurity
cyber attacks
social networks
machine learning
text processing
data tracking
sentiment analysis
topic segurança cibernética
ataques cibernéticos
redes sociais
machine learning
processamento de texto
rastreamento de dados
análise de sentimentos
cybersecurity
cyber attacks
social networks
machine learning
text processing
data tracking
sentiment analysis
description Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-05
2024-02-28T12:00:17Z
2024-02-28T12:00:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.fei.edu.br/handle/FEI/5284
url https://repositorio.fei.edu.br/handle/FEI/5284
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 49
application/pdf
application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da FEI
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Biblioteca Digital de Teses e Dissertações da FEI
collection Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1809225180674785280