Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas

Saul, Gabriel Holmer

Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas

Detalhes bibliográficos
Autor(a) principal:	Saul, Gabriel Holmer
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRGS
Texto Completo:	http://hdl.handle.net/10183/267734
Resumo:	O aumento contínuo da geração e armazenamento de dados de texto, somado ao expressivo aumento do poder computacional, trouxe a necessidade de se ajustar modelos estatísticos mais complexos, provocando uma demanda substancial por métodos da área de Processamento de Linguagem Natural (NLP). As técnicas de NLP podem ser aplicadas em um vasto número de tarefas, como tradução de máquina, análise de sentimento e classificação de texto. Dentre estas tarefas, destaca-se a detecção automatizada de notícias falsas, também chamadas de fake news, que são cada vez mais presentes na sociedade com o advento de programas de computadores capazes de gerar e disseminar notícias falsas entre diversos meios de comunicação. Para combater a propagação de fake news, é possível utilizar o modelo de NLP BERT, que é capaz de representar o significado semântico e sintático de uma palavra a partir do seu contexto. Neste trabalho, é feita uma aplicação do modelo BERT para determinar se uma notícia específica de língua inglesa é falsa ou não, analisando a descrição textual de seu título. O banco de dados utilizado contém 72.134 notícias, já categorizadas entre verdadeiras e falsas, que foram extraídas de diferentes portais. Os resultados apontam para um bom desempenho do modelo ajustado, o que pode contribuir no combate à desinformação e auxiliar estudos futuros na área.

Metadados do item

id	UFRGS-2_47dd708ff3433b88eaac02cfe4d600f6
oai_identifier_str	oai:www.lume.ufrgs.br:10183/267734
network_acronym_str	UFRGS-2
network_name_str	Repositório Institucional da UFRGS
repository_id_str
spelling	Saul, Gabriel HolmerBarbian, Márcia Helena2023-11-28T03:23:37Z2023http://hdl.handle.net/10183/267734001188417O aumento contínuo da geração e armazenamento de dados de texto, somado ao expressivo aumento do poder computacional, trouxe a necessidade de se ajustar modelos estatísticos mais complexos, provocando uma demanda substancial por métodos da área de Processamento de Linguagem Natural (NLP). As técnicas de NLP podem ser aplicadas em um vasto número de tarefas, como tradução de máquina, análise de sentimento e classificação de texto. Dentre estas tarefas, destaca-se a detecção automatizada de notícias falsas, também chamadas de fake news, que são cada vez mais presentes na sociedade com o advento de programas de computadores capazes de gerar e disseminar notícias falsas entre diversos meios de comunicação. Para combater a propagação de fake news, é possível utilizar o modelo de NLP BERT, que é capaz de representar o significado semântico e sintático de uma palavra a partir do seu contexto. Neste trabalho, é feita uma aplicação do modelo BERT para determinar se uma notícia específica de língua inglesa é falsa ou não, analisando a descrição textual de seu título. O banco de dados utilizado contém 72.134 notícias, já categorizadas entre verdadeiras e falsas, que foram extraídas de diferentes portais. Os resultados apontam para um bom desempenho do modelo ajustado, o que pode contribuir no combate à desinformação e auxiliar estudos futuros na área.The continuous increase in the generation and storage of text data, added to the significant increase in computational power, brought the need to fit more complex statistical models, causing a substantial demand for methods in the field of Natural Language Processing (NLP). NLP techniques can be applied to a vast number of tasks, such as machine translation, sentiment analysis and text classification. Among these tasks, the automated detection of fake news stands out, which are increasingly present in society with the advent of computer programs capable of generating and disseminating fake news among various means of communication. To combat the spread of fake news, it is possible to use the BERT NLP model, which is capable of representing the semantic and syntactic meaning of a word from its context. In this work, an application of the BERT model is made to determine whether a certain news article in English is fake or not, analyzing the textual description of its title. The dataset used contains 72,134 news, already categorized between true and false, which were extracted from different portals. The results point to a good performance of the adjusted model, which can contribute to the fight against misinformation and help future studies in the area.application/pdfporProcessamento de linguagem naturalNotícia falsaNatural language processingDeep learningWord embeddingsTransformersFake newsUma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPorto Alegre, BR-RS2023Estatística: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001188417.pdf.txt001188417.pdf.txtExtracted Texttext/plain115479http://www.lume.ufrgs.br/bitstream/10183/267734/2/001188417.pdf.txtc2dffb71be6159bd8445145c7ccf968dMD52ORIGINAL001188417.pdfTexto completoapplication/pdf1960615http://www.lume.ufrgs.br/bitstream/10183/267734/1/001188417.pdf4956a7e9b3ed1cbb72473efb6277e464MD5110183/2677342023-11-29 04:26:08.195607oai:www.lume.ufrgs.br:10183/267734Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2023-11-29T06:26:08Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
title	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
spellingShingle	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas Saul, Gabriel Holmer Processamento de linguagem natural Notícia falsa Natural language processing Deep learning Word embeddings Transformers Fake news
title_short	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
title_full	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
title_fullStr	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
title_full_unstemmed	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
title_sort	Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
author	Saul, Gabriel Holmer
author_facet	Saul, Gabriel Holmer
author_role	author
dc.contributor.author.fl_str_mv	Saul, Gabriel Holmer
dc.contributor.advisor1.fl_str_mv	Barbian, Márcia Helena
contributor_str_mv	Barbian, Márcia Helena
dc.subject.por.fl_str_mv	Processamento de linguagem natural Notícia falsa
topic	Processamento de linguagem natural Notícia falsa Natural language processing Deep learning Word embeddings Transformers Fake news
dc.subject.eng.fl_str_mv	Natural language processing Deep learning Word embeddings Transformers Fake news
description	O aumento contínuo da geração e armazenamento de dados de texto, somado ao expressivo aumento do poder computacional, trouxe a necessidade de se ajustar modelos estatísticos mais complexos, provocando uma demanda substancial por métodos da área de Processamento de Linguagem Natural (NLP). As técnicas de NLP podem ser aplicadas em um vasto número de tarefas, como tradução de máquina, análise de sentimento e classificação de texto. Dentre estas tarefas, destaca-se a detecção automatizada de notícias falsas, também chamadas de fake news, que são cada vez mais presentes na sociedade com o advento de programas de computadores capazes de gerar e disseminar notícias falsas entre diversos meios de comunicação. Para combater a propagação de fake news, é possível utilizar o modelo de NLP BERT, que é capaz de representar o significado semântico e sintático de uma palavra a partir do seu contexto. Neste trabalho, é feita uma aplicação do modelo BERT para determinar se uma notícia específica de língua inglesa é falsa ou não, analisando a descrição textual de seu título. O banco de dados utilizado contém 72.134 notícias, já categorizadas entre verdadeiras e falsas, que foram extraídas de diferentes portais. Os resultados apontam para um bom desempenho do modelo ajustado, o que pode contribuir no combate à desinformação e auxiliar estudos futuros na área.
publishDate	2023
dc.date.accessioned.fl_str_mv	2023-11-28T03:23:37Z
dc.date.issued.fl_str_mv	2023
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/267734
dc.identifier.nrb.pt_BR.fl_str_mv	001188417
url	http://hdl.handle.net/10183/267734
identifier_str_mv	001188417
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Repositório Institucional da UFRGS
collection	Repositório Institucional da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/267734/2/001188417.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/267734/1/001188417.pdf
bitstream.checksum.fl_str_mv	c2dffb71be6159bd8445145c7ccf968d 4956a7e9b3ed1cbb72473efb6277e464
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br
_version_	1817724754432360448

Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas

Registros relacionados