Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens

Detalhes bibliográficos
Autor(a) principal: Moser, Gustavo Vicente Barroso
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/243553
Resumo: TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
id UFSC_55cf17d406041fe983b91c683f404d25
oai_identifier_str oai:repositorio.ufsc.br:123456789/243553
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokensNotícias falsasTwitterSaúdeCasamento de dadosWord embeddingsTCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.Com o crescimento do acesso aos meios de comunicação e a popularização das redes sociais, o termo fake news ganha cada vez mais forma e espaço. O termo é utilizado para denominar informações falsas, mentiras que circulam pelos meios de informação. Diferentemente de sátiras, fake news são publicadas com a intenção de enganar os leitores a fim de obter ganhos, sejam eles políticos ou financeiros, geralmente acompanhados de títulos sensacionalistas para chamar a atenção. O Twitter é uma rede social voltada para comunicação em tempo real utilizada por milhões de usuários, é nela que muitas fake news são divulgadas e conseguem tomar grandes proporções. A possibilidade de compartilhar informações com apenas um clique faz com que sua disseminação se dê muito rapidamente. Um exemplo atual diz respeito às fake news que têm circulado sobre temas voltados à saúde. Com o surto da COVID-19 pelo planeta, muitos viram oportunidades de gerar informações falsas a respeito do uso de máscaras, vacinas, entre outros. Portanto, nesse contexto, o objetivo do presente trabalho é desenvolver uma solução para localizar tweets com informações cuja veracidade possa ser checada com experimentos publicados em artigos científicos, utilizando casamento de dados e similaridade semântica, posteriormente, classificando-os tweets como fraudulentos ou não.As the access to the media grows, and the popularity of social networks increases, the term "fake news" gets more and more form and space. This term is used to denote false information, lies that surround through the media. Unlike satires, the fake news are published intending to deceive readers in order to get gains that can be financial or political, and usually are followed by sensationalist titles to get attention. Twitter is a social network focused on real-time communication, used by millions of users. It is where a lot of news spread and can take large proportions. The possibility of sharing information with just one click makes the dissemination of it happen very quickly. A current example concerns the false news that have been circulating on health-related topics. While the outbreak of COVID-19 generates a crisis across the planet, many opportunities to create false information regarding the use of masks, vaccines, and others. Therefore, in this context, the objective of the present work is to develop a solution to locate tweets whose veracity can be checked with experiments published in scientific articles, using data matching and semantic similarity, and later classifying them as fraudulent or not.Florianópolis, SC.Dorneles, Carina FriedrichUniversidade Federal de Santa Catarina.Moser, Gustavo Vicente Barroso2022-12-23T20:59:05Z2022-12-23T20:59:05Z2022-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis98application/pdfapplication/octet-streamhttps://repositorio.ufsc.br/handle/123456789/243553Open Access.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2022-12-23T20:59:05Zoai:repositorio.ufsc.br:123456789/243553Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732022-12-23T20:59:05Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
title Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
spellingShingle Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
Moser, Gustavo Vicente Barroso
Notícias falsas
Twitter
Saúde
Casamento de dados
Word embeddings
title_short Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
title_full Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
title_fullStr Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
title_full_unstemmed Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
title_sort Análise de similaridade entre TF-IDF e modelos contextualizados de linguagem baseados em tokens
author Moser, Gustavo Vicente Barroso
author_facet Moser, Gustavo Vicente Barroso
author_role author
dc.contributor.none.fl_str_mv Dorneles, Carina Friedrich
Universidade Federal de Santa Catarina.
dc.contributor.author.fl_str_mv Moser, Gustavo Vicente Barroso
dc.subject.por.fl_str_mv Notícias falsas
Twitter
Saúde
Casamento de dados
Word embeddings
topic Notícias falsas
Twitter
Saúde
Casamento de dados
Word embeddings
description TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-23T20:59:05Z
2022-12-23T20:59:05Z
2022-12-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/243553
url https://repositorio.ufsc.br/handle/123456789/243553
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Open Access.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Open Access.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 98
application/pdf
application/octet-stream
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651996032401408