Do tweet à ameaça:

Oliveira, Hugo Linhares; Cezarino, João Pedro Rosa; Lacerda, Thales de Oliveira; Oliveira, Vitor Martins

Do tweet à ameaça:

Detalhes bibliográficos
Autor(a) principal:	Oliveira, Hugo Linhares
Data de Publicação:	2023
Outros Autores:	Cezarino, João Pedro Rosa, Lacerda, Thales de Oliveira, Oliveira, Vitor Martins
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo:	https://repositorio.fei.edu.br/handle/FEI/5284
Resumo:	Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.

Metadados do item

id	FEI_1d0cc422f2a2c15caf7b70ba100e9a72
oai_identifier_str	oai:repositorio.fei.edu.br:FEI/5284
network_acronym_str	FEI
network_name_str	Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str	https://repositorio.fei.edu.br/oai/request
spelling	Do tweet à ameaça:um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem naturalsegurança cibernéticaataques cibernéticosredes sociaismachine learningprocessamento de textorastreamento de dadosanálise de sentimentoscybersecuritycyber attackssocial networksmachine learningtext processingdata trackingsentiment analysisCom o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.With the increase in cyber attacks, digital security becomes crucial. Social networks, especially Twitter, are platforms where hackers express their intentions. This work proposes a method for extracting and analyzing data from these networks using Machine Learning techniques and text preprocessing to identify patterns indicative of cyber threats. In the face of this challenge, two approaches are presented: the first combines sentiment analysis, entity recognition, and similarity with information security keywords into a single vector representation, along with the results of a classification algorithm. The second approach uses a weighted score for each attribute of the analysis mechanism, aiming for a more refined approach in detecting potential threats. The results highlight the importance of entity analysis in improving the model's accuracy, where it was found that dates and numbers are more prevalent in communications containing threats. Moreover, the obtained results challenge the effectiveness of sentiment analysis as a reliable indicator, defying the premise that sentiment polarity is a sure sign of malicious content in the identification of potentially dangerous tweets. In this scenario, the Random Forest algorithm stood out, achieving an accuracy of up to 79.59% in classifying tweets as threats, compared to a 79.25% baseline.Ferreira, Charles Henrique Portohttp://lattes.cnpq.br/9346953261085205Oliveira, Hugo LinharesCezarino, João Pedro RosaLacerda, Thales de OliveiraOliveira, Vitor Martins2024-02-28T12:00:17Z2024-02-28T12:00:17Z2023-12-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis49application/pdfapplication/pdfhttps://repositorio.fei.edu.br/handle/FEI/5284info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEI2024-03-01T03:00:24Zoai:repositorio.fei.edu.br:FEI/5284Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T03:00:24Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv	Do tweet à ameaça: um estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem natural
title	Do tweet à ameaça:
spellingShingle	Do tweet à ameaça: Oliveira, Hugo Linhares segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis
title_short	Do tweet à ameaça:
title_full	Do tweet à ameaça:
title_fullStr	Do tweet à ameaça:
title_full_unstemmed	Do tweet à ameaça:
title_sort	Do tweet à ameaça:
author	Oliveira, Hugo Linhares
author_facet	Oliveira, Hugo Linhares Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins
author_role	author
author2	Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins
author2_role	author author author
dc.contributor.none.fl_str_mv	Ferreira, Charles Henrique Porto http://lattes.cnpq.br/9346953261085205
dc.contributor.author.fl_str_mv	Oliveira, Hugo Linhares Cezarino, João Pedro Rosa Lacerda, Thales de Oliveira Oliveira, Vitor Martins
dc.subject.por.fl_str_mv	segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis
topic	segurança cibernética ataques cibernéticos redes sociais machine learning processamento de texto rastreamento de dados análise de sentimentos cybersecurity cyber attacks social networks machine learning text processing data tracking sentiment analysis
description	Com o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.
publishDate	2023
dc.date.none.fl_str_mv	2023-12-05 2024-02-28T12:00:17Z 2024-02-28T12:00:17Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.fei.edu.br/handle/FEI/5284
url	https://repositorio.fei.edu.br/handle/FEI/5284
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	49 application/pdf application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI
instname_str	Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str	FEI
institution	FEI
reponame_str	Biblioteca Digital de Teses e Dissertações da FEI
collection	Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv	cfernandes@fei.edu.br
_version_	1809225180674785280

Do tweet à ameaça:

Registros relacionados