Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News

Gusmão, Felipe dos Santos

Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News

Detalhes bibliográficos
Autor(a) principal:	Gusmão, Felipe dos Santos
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFAM
Texto Completo:	http://riu.ufam.edu.br/handle/prefix/6934
Resumo:	The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.

Metadados do item

id	UFAM-1_889f51a893e12e1c2faf83437ae109f7
oai_identifier_str	oai:localhost:prefix/6934
network_acronym_str	UFAM-1
network_name_str	Repositório Institucional da UFAM
repository_id_str
spelling	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake NewsFake newsBERTDistilBERTBERTimbauENGENHARIASProcessamento de linguagem natural (Computação)Inteligência artificialNotícias falsasDesinformaçãoThe present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento.1NãoBrasilFT - Faculdade de TecnologiaManaus (AM)Engenharia da Computação - Bacharelado - ManausPio, José Luiz de Souzahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23JCaldas, Ruiter BragaJanuário, Francisco de Assis PereiraGusmão, Felipe dos Santos2023-09-27T14:39:12Z2023-09-27T14:39:12Z2023-06-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://riu.ufam.edu.br/handle/prefix/6934porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2023-09-27T14:39:32Zoai:localhost:prefix/6934Repositório InstitucionalPUBhttp://riu.ufam.edu.br/oai/requestopendoar:2023-09-27T14:39:32Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
spellingShingle	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News Gusmão, Felipe dos Santos Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação
title_short	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_full	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_fullStr	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_full_unstemmed	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_sort	Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
author	Gusmão, Felipe dos Santos
author_facet	Gusmão, Felipe dos Santos
author_role	author
dc.contributor.none.fl_str_mv	Pio, José Luiz de Souza http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23J Caldas, Ruiter Braga Januário, Francisco de Assis Pereira
dc.contributor.author.fl_str_mv	Gusmão, Felipe dos Santos
dc.subject.por.fl_str_mv	Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação
topic	Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação
description	The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.
publishDate	2023
dc.date.none.fl_str_mv	2023-09-27T14:39:12Z 2023-09-27T14:39:12Z 2023-06-28
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://riu.ufam.edu.br/handle/prefix/6934
url	http://riu.ufam.edu.br/handle/prefix/6934
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Brasil FT - Faculdade de Tecnologia Manaus (AM) Engenharia da Computação - Bacharelado - Manaus
publisher.none.fl_str_mv	Brasil FT - Faculdade de Tecnologia Manaus (AM) Engenharia da Computação - Bacharelado - Manaus
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM
instname_str	Universidade Federal do Amazonas (UFAM)
instacron_str	UFAM
institution	UFAM
reponame_str	Repositório Institucional da UFAM
collection	Repositório Institucional da UFAM
repository.name.fl_str_mv	Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv
_version_	1798061062705119232

Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News

Registros relacionados