Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News

Detalhes bibliográficos
Autor(a) principal: Gusmão, Felipe dos Santos
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFAM
Texto Completo: http://riu.ufam.edu.br/handle/prefix/6934
Resumo: The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.
id UFAM-1_889f51a893e12e1c2faf83437ae109f7
oai_identifier_str oai:localhost:prefix/6934
network_acronym_str UFAM-1
network_name_str Repositório Institucional da UFAM
repository_id_str
spelling Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake NewsFake newsBERTDistilBERTBERTimbauENGENHARIASProcessamento de linguagem natural (Computação)Inteligência artificialNotícias falsasDesinformaçãoThe present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento.1NãoBrasilFT - Faculdade de TecnologiaManaus (AM)Engenharia da Computação - Bacharelado - ManausPio, José Luiz de Souzahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23JCaldas, Ruiter BragaJanuário, Francisco de Assis PereiraGusmão, Felipe dos Santos2023-09-27T14:39:12Z2023-09-27T14:39:12Z2023-06-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://riu.ufam.edu.br/handle/prefix/6934porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2023-09-27T14:39:32Zoai:localhost:prefix/6934Repositório InstitucionalPUBhttp://riu.ufam.edu.br/oai/requestopendoar:2023-09-27T14:39:32Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
spellingShingle Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
Gusmão, Felipe dos Santos
Fake news
BERT
DistilBERT
BERTimbau
ENGENHARIAS
Processamento de linguagem natural (Computação)
Inteligência artificial
Notícias falsas
Desinformação
title_short Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_full Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_fullStr Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_full_unstemmed Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
title_sort Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
author Gusmão, Felipe dos Santos
author_facet Gusmão, Felipe dos Santos
author_role author
dc.contributor.none.fl_str_mv Pio, José Luiz de Souza
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23J
Caldas, Ruiter Braga
Januário, Francisco de Assis Pereira
dc.contributor.author.fl_str_mv Gusmão, Felipe dos Santos
dc.subject.por.fl_str_mv Fake news
BERT
DistilBERT
BERTimbau
ENGENHARIAS
Processamento de linguagem natural (Computação)
Inteligência artificial
Notícias falsas
Desinformação
topic Fake news
BERT
DistilBERT
BERTimbau
ENGENHARIAS
Processamento de linguagem natural (Computação)
Inteligência artificial
Notícias falsas
Desinformação
description The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.
publishDate 2023
dc.date.none.fl_str_mv 2023-09-27T14:39:12Z
2023-09-27T14:39:12Z
2023-06-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://riu.ufam.edu.br/handle/prefix/6934
url http://riu.ufam.edu.br/handle/prefix/6934
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Brasil
FT - Faculdade de Tecnologia
Manaus (AM)
Engenharia da Computação - Bacharelado - Manaus
publisher.none.fl_str_mv Brasil
FT - Faculdade de Tecnologia
Manaus (AM)
Engenharia da Computação - Bacharelado - Manaus
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Repositório Institucional da UFAM
collection Repositório Institucional da UFAM
repository.name.fl_str_mv Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv
_version_ 1798061062705119232