Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.

SOARES, Caio Maxximus Pereira.

Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.

Detalhes bibliográficos
Autor(a) principal:	SOARES, Caio Maxximus Pereira.
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514
Resumo:	A busca por extração de características em textos é uma área de interesse em aprendizagem de máquina devido às inúmeras possibilidades relacionadas, dentre elas a verificação de autoria é um tema relevante por suas aplicações e elevada complexidade. Neste contexto, o presente artigo faz uso de dados provenientes de mensagens de chat de servidores Discord com o propósito de verificar automaticamente a autoria das mensagens mediante um treinamento supervisionado. O processo inicia-se com um pré-processamento que busca reduzir ruído e viés nos dados, para então explorar a capacidade do modelo de aprendizagem em generalizar ao encontrar textos desconhecidos e defini-los como de sua autoria ou não. Desta forma são utilizados grafos como extratores de características em mensagens de texto, utilizando de redes neurais artificiais como modelos de aprendizagem de máquina para classificá-las . Palavras se tornam nós, e suas arestas capturam a intensidade referente à distância dos termos na frase, resultando na construção de um grafo que representa o vocabulário de um indivíduo e que tem como objetivo captar características relevantes no texto.Obtidas boas acurácias para o verdadeiros positivos e para os verdadeiros negativos ao se ajustar o limiar de ativação, os modelos conseguem alcançar resultados satisfatórios com reduzido custo de treinamento, permitindo uma facilidade maior para exploração de novos parâmetros.

Metadados do item

id	UFCG_471661826abb7203af6f2046788575ea
oai_identifier_str	oai:localhost:riufcg/30514
network_acronym_str	UFCG
network_name_str	Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str	4851
spelling	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.Verification of authorship in text messages using graphs and machine learning.Grafos - fontes d einformaçãoAutoria - mensagens de textoMensagens de texto - autoriaAprendizagem de máquinaVerificação de autoria - mensagens de textoMensagens de chat - servidores DiscordMedidas de distância - computaçãoRede neuralGraphs - sources of informationAuthoring - text messagesText messages - authoringMachine learningAuthorship verification - text messagesChat messages - Discord serversDistance measurements - computingNeural networkCiência da Computação.A busca por extração de características em textos é uma área de interesse em aprendizagem de máquina devido às inúmeras possibilidades relacionadas, dentre elas a verificação de autoria é um tema relevante por suas aplicações e elevada complexidade. Neste contexto, o presente artigo faz uso de dados provenientes de mensagens de chat de servidores Discord com o propósito de verificar automaticamente a autoria das mensagens mediante um treinamento supervisionado. O processo inicia-se com um pré-processamento que busca reduzir ruído e viés nos dados, para então explorar a capacidade do modelo de aprendizagem em generalizar ao encontrar textos desconhecidos e defini-los como de sua autoria ou não. Desta forma são utilizados grafos como extratores de características em mensagens de texto, utilizando de redes neurais artificiais como modelos de aprendizagem de máquina para classificá-las . Palavras se tornam nós, e suas arestas capturam a intensidade referente à distância dos termos na frase, resultando na construção de um grafo que representa o vocabulário de um indivíduo e que tem como objetivo captar características relevantes no texto.Obtidas boas acurácias para o verdadeiros positivos e para os verdadeiros negativos ao se ajustar o limiar de ativação, os modelos conseguem alcançar resultados satisfatórios com reduzido custo de treinamento, permitindo uma facilidade maior para exploração de novos parâmetros.The search for feature extraction in texts is an area of interest in machine learning due to its numerous related possibilities, among them authorship verification is a relevant topic due to its applications and high complexity. In this context, this article uses data from Discord server chat messages with the purpose of automatically verifying the authorship of messages through supervised training. The process begins with preprocessing that aims to reduce noise and bias in the data, and then explores the learning model's ability to generalize by identifying unknown texts and classifying them as either authored or not. Graphs are used as feature extractors in text messages, leveraging artificial neural networks as machine learning models for classification. Words become nodes, and their edges capture the intensity related to the distance between terms in the sentence, resulting in the construction of a graph that represents an individual's vocabulary and aims to capture relevant characteristics in the text. By achieving good accuracies for true positives and true negatives when adjusting the activation threshold, the models can achieve satisfactory results with reduced training cost, allowing for easier exploration of new parameters.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIUFCGGOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271MACHADO, Patrícia Duarte de Lima.MACHADO, P. D. L.http://lattes.cnpq.br/2495918356675019BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897SOARES, Caio Maxximus Pereira.2023-06-282023-07-03T12:22:23Z2023-07-032023-07-03T12:22:23Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514SOARES, Caio Maxximus Pereira. Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2023-07-03T12:26:19Zoai:localhost:riufcg/30514Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.bropendoar:48512023-07-03T12:26:19Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. Verification of authorship in text messages using graphs and machine learning.
title	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
spellingShingle	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. SOARES, Caio Maxximus Pereira. Grafos - fontes d einformação Autoria - mensagens de texto Mensagens de texto - autoria Aprendizagem de máquina Verificação de autoria - mensagens de texto Mensagens de chat - servidores Discord Medidas de distância - computação Rede neural Graphs - sources of information Authoring - text messages Text messages - authoring Machine learning Authorship verification - text messages Chat messages - Discord servers Distance measurements - computing Neural network Ciência da Computação.
title_short	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
title_full	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
title_fullStr	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
title_full_unstemmed	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
title_sort	Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.
author	SOARES, Caio Maxximus Pereira.
author_facet	SOARES, Caio Maxximus Pereira.
author_role	author
dc.contributor.none.fl_str_mv	GOMES, Herman Martins. GOMES, H. M. http://lattes.cnpq.br/4223020694433271 MACHADO, Patrícia Duarte de Lima. MACHADO, P. D. L. http://lattes.cnpq.br/2495918356675019 BRASILEIRO, Francisco Vilar. BRASILEIRO, F. V. http://lattes.cnpq.br/5957855817378897
dc.contributor.author.fl_str_mv	SOARES, Caio Maxximus Pereira.
dc.subject.por.fl_str_mv	Grafos - fontes d einformação Autoria - mensagens de texto Mensagens de texto - autoria Aprendizagem de máquina Verificação de autoria - mensagens de texto Mensagens de chat - servidores Discord Medidas de distância - computação Rede neural Graphs - sources of information Authoring - text messages Text messages - authoring Machine learning Authorship verification - text messages Chat messages - Discord servers Distance measurements - computing Neural network Ciência da Computação.
topic	Grafos - fontes d einformação Autoria - mensagens de texto Mensagens de texto - autoria Aprendizagem de máquina Verificação de autoria - mensagens de texto Mensagens de chat - servidores Discord Medidas de distância - computação Rede neural Graphs - sources of information Authoring - text messages Text messages - authoring Machine learning Authorship verification - text messages Chat messages - Discord servers Distance measurements - computing Neural network Ciência da Computação.
description	A busca por extração de características em textos é uma área de interesse em aprendizagem de máquina devido às inúmeras possibilidades relacionadas, dentre elas a verificação de autoria é um tema relevante por suas aplicações e elevada complexidade. Neste contexto, o presente artigo faz uso de dados provenientes de mensagens de chat de servidores Discord com o propósito de verificar automaticamente a autoria das mensagens mediante um treinamento supervisionado. O processo inicia-se com um pré-processamento que busca reduzir ruído e viés nos dados, para então explorar a capacidade do modelo de aprendizagem em generalizar ao encontrar textos desconhecidos e defini-los como de sua autoria ou não. Desta forma são utilizados grafos como extratores de características em mensagens de texto, utilizando de redes neurais artificiais como modelos de aprendizagem de máquina para classificá-las . Palavras se tornam nós, e suas arestas capturam a intensidade referente à distância dos termos na frase, resultando na construção de um grafo que representa o vocabulário de um indivíduo e que tem como objetivo captar características relevantes no texto.Obtidas boas acurácias para o verdadeiros positivos e para os verdadeiros negativos ao se ajustar o limiar de ativação, os modelos conseguem alcançar resultados satisfatórios com reduzido custo de treinamento, permitindo uma facilidade maior para exploração de novos parâmetros.
publishDate	2023
dc.date.none.fl_str_mv	2023-06-28 2023-07-03T12:22:23Z 2023-07-03 2023-07-03T12:22:23Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514 SOARES, Caio Maxximus Pereira. Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514
url	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514
identifier_str_mv	SOARES, Caio Maxximus Pereira. Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30514
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG
publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI UFCG
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG
instname_str	Universidade Federal de Campina Grande (UFCG)
instacron_str	UFCG
institution	UFCG
reponame_str	Biblioteca Digital de Teses e Dissertações da UFCG
collection	Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv	bdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.br
_version_	1809744582948159488

Verificação de autoria em mensagens de texto utilizando grafos e aprendizagem de máquina.

Registros relacionados