Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFAM |
Texto Completo: | http://riu.ufam.edu.br/handle/prefix/6934 |
Resumo: | The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment. |
id |
UFAM-1_889f51a893e12e1c2faf83437ae109f7 |
---|---|
oai_identifier_str |
oai:localhost:prefix/6934 |
network_acronym_str |
UFAM-1 |
network_name_str |
Repositório Institucional da UFAM |
repository_id_str |
|
spelling |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake NewsFake newsBERTDistilBERTBERTimbauENGENHARIASProcessamento de linguagem natural (Computação)Inteligência artificialNotícias falsasDesinformaçãoThe present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment.O presente trabalho objetiva analisar o desempenho de três modelos de clas- sificação de texto para a identificação de notícias falsas (fake news). Foi de- senvolvido um sistema de classificação de notícias utilizando variações do modelo BERT. Os modelos utilizados foram: BERT, DistilBERT e o BERTimbau. O cenário definido foi analisar 7200 amostras de notícias em português que estão pré-classificadas no corpus Fake.Br em 2 classes, notícias verdadeiras e notícias falsas, com 3600 amostras para cada classe. Foi comparada a per- formance dos 3 modelos para classificação do corpus utilizando as métricas de precisão, acurácia, e F1 de cada um dos modelos. Como esperado, já que é um modelo pré-treinado em português, o modelo BERTimbau apresentou os melhores resultados dentro das métricas avaliadas, obtendo 98% de precisão no segundo experimento.1NãoBrasilFT - Faculdade de TecnologiaManaus (AM)Engenharia da Computação - Bacharelado - ManausPio, José Luiz de Souzahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23JCaldas, Ruiter BragaJanuário, Francisco de Assis PereiraGusmão, Felipe dos Santos2023-09-27T14:39:12Z2023-09-27T14:39:12Z2023-06-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttp://riu.ufam.edu.br/handle/prefix/6934porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2023-09-27T14:39:32Zoai:localhost:prefix/6934Repositório InstitucionalPUBhttp://riu.ufam.edu.br/oai/requestopendoar:2023-09-27T14:39:32Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM)false |
dc.title.none.fl_str_mv |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
title |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
spellingShingle |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News Gusmão, Felipe dos Santos Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação |
title_short |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
title_full |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
title_fullStr |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
title_full_unstemmed |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
title_sort |
Estudo comparativo de modelos de classificação textual aplicados na classificação de Fake News |
author |
Gusmão, Felipe dos Santos |
author_facet |
Gusmão, Felipe dos Santos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pio, José Luiz de Souza http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761566T6&tokenCaptchar=03AAYGu2TuxAi4FB0MqJ5xuV7Zdj158w4Hv7zKBoc_Tr6yixYscGgiF67_6SDrnBU18ZIG49C2eoH2f2zdCIPKpDVjfcGwVrB3juaiuAMVwgLU0ZswUGaoZdeWIHVXPMptNUz1jw5KaMFJTQXUDoy68hJ4wE3Xnoljm1uOxzkcZay1Gfxl1tojFbdC0qbCrdFANHf3X9snyi2fkcOW9vhzDrlzbcevpd-TlaYlY9nBpJ1Mc38km0Dom-vSAUALXXNjxDudt1ztOJLhehZ9rd60ZrJLXsSIvJNjE8N5EeC-QJeuZwCL3C8hbvaZPMYhKyMV7q_V3sQrGzKakZoXBZJihWnXDv81jYUTgjHvLUlRFIF1gq6UR4ERv7ZT5zrx39N8OY4X67ZIqCrHmLmNeYy_shRgUTVkN-WfSZe9mPKn5xRfrLd5at5bMd_iQ0-5_joenoGjsIWVa5Ce0dpwOwJC13FWw2M2d6nYycpcSnDD-391sLfI0baV6_JwxQXYuo29TPe6xi0G2Mdt1V7rImu7QIrTh3M_gBVCS7vCF6dMKvHs6VAaq3S0TSdldM-qXBpzihKrV3a6n23J Caldas, Ruiter Braga Januário, Francisco de Assis Pereira |
dc.contributor.author.fl_str_mv |
Gusmão, Felipe dos Santos |
dc.subject.por.fl_str_mv |
Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação |
topic |
Fake news BERT DistilBERT BERTimbau ENGENHARIAS Processamento de linguagem natural (Computação) Inteligência artificial Notícias falsas Desinformação |
description |
The present work aims to analyze the performance of three text classification models for identifying fake news. A news classification system was developed using variations of the BERT model. The models used were: BERT, DistilBERT and BERTimbau. The defined scenario was to analyze 7200 samples of news in Portuguese that are pre-classified in the Fake.br corpus into 2 classes, true news and fake news, with 3600 samples for each class. The performance of the 3 models for classifying this corpus was compared using metrics of precision, accuracy, and F1 of each of the models. As expected, as it is a pre-trained model in portuguese, the BERTimbau model presented the best results within the evaluated metrics, getting 98% precision on the second experiment. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-09-27T14:39:12Z 2023-09-27T14:39:12Z 2023-06-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://riu.ufam.edu.br/handle/prefix/6934 |
url |
http://riu.ufam.edu.br/handle/prefix/6934 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Brasil FT - Faculdade de Tecnologia Manaus (AM) Engenharia da Computação - Bacharelado - Manaus |
publisher.none.fl_str_mv |
Brasil FT - Faculdade de Tecnologia Manaus (AM) Engenharia da Computação - Bacharelado - Manaus |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
instname_str |
Universidade Federal do Amazonas (UFAM) |
instacron_str |
UFAM |
institution |
UFAM |
reponame_str |
Repositório Institucional da UFAM |
collection |
Repositório Institucional da UFAM |
repository.name.fl_str_mv |
Repositório Institucional da UFAM - Universidade Federal do Amazonas (UFAM) |
repository.mail.fl_str_mv |
|
_version_ |
1798061062705119232 |