Detecção de fake news em português utilizando inferência de linguagem natural

Detalhes bibliográficos
Autor(a) principal: Hondo, Larissa Mayumi Barela
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: https://hdl.handle.net/11449/251490
Resumo: Com o advento da Internet, é possível obter informações a partir de quaisquer fontes sobre eventos ao redor do mundo, inclusive informações imprecisas e até mesmo falsas, sendo estas chamadas de fake news. A divulgação e a proliferação de fake news podem causar prejuízos e danos seríssimos para as pessoas e para a sociedade de modo geral, salientando a extrema importância de sua identificação. Isso pode ser feito com o uso do Processamento de Linguagem Natural, que abrange técnicas computacionais para a análise automática e à representação de linguagens antropológicas. Por exemplo, a detecção de fake news pode ser feita com a Inferência de Linguagem Natural, uma sub-área do Processamento de Linguagem Natural focada na verificação da implicação ou contradição em um par de sentenças, que pode ser utilizada neste contexto considerando notícias já confirmadas como sendo verdadeiras como a premissa e uma notícia suspeita como a hipótese, dessa forma, caso haja contradição entre a hipótese e a premissa, a notícia suspeita é considerada falsa, caso contrário, ela é rotulada como verdadeira. Visto isso, o objetivo deste trabalho é propor um método de detecção automática de fake news para a língua portuguesa utilizando a Inferência de Linguagem Natural. Como não há uma base de dados em português que utilize a Inferência de Linguagem Natural para esta aplicação, é possível traduzir dados já existentes para este idioma, em vista disso, neste trabalho utilizou-se a base de dados em inglês denominada FNID-FakeNewsNet. Com base nos resultados obtidos para o conjunto de teste, observa-se um desempenho melhor quando a premissa é utilizada junto à hipótese. Além disso, de modo geral, é possível observar que os resultados não foram afetados significativamente pela tradução dos dados em inglês para o português.
id UNSP_0f02157755ca825abf04bddb58eeeb29
oai_identifier_str oai:repositorio.unesp.br:11449/251490
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Detecção de fake news em português utilizando inferência de linguagem naturalFake news detection in portuguese using natural language inferenceFake newsNatural language inferenceNatural language processingInferência de linguagem naturalProcessamento de linguagem naturalCom o advento da Internet, é possível obter informações a partir de quaisquer fontes sobre eventos ao redor do mundo, inclusive informações imprecisas e até mesmo falsas, sendo estas chamadas de fake news. A divulgação e a proliferação de fake news podem causar prejuízos e danos seríssimos para as pessoas e para a sociedade de modo geral, salientando a extrema importância de sua identificação. Isso pode ser feito com o uso do Processamento de Linguagem Natural, que abrange técnicas computacionais para a análise automática e à representação de linguagens antropológicas. Por exemplo, a detecção de fake news pode ser feita com a Inferência de Linguagem Natural, uma sub-área do Processamento de Linguagem Natural focada na verificação da implicação ou contradição em um par de sentenças, que pode ser utilizada neste contexto considerando notícias já confirmadas como sendo verdadeiras como a premissa e uma notícia suspeita como a hipótese, dessa forma, caso haja contradição entre a hipótese e a premissa, a notícia suspeita é considerada falsa, caso contrário, ela é rotulada como verdadeira. Visto isso, o objetivo deste trabalho é propor um método de detecção automática de fake news para a língua portuguesa utilizando a Inferência de Linguagem Natural. Como não há uma base de dados em português que utilize a Inferência de Linguagem Natural para esta aplicação, é possível traduzir dados já existentes para este idioma, em vista disso, neste trabalho utilizou-se a base de dados em inglês denominada FNID-FakeNewsNet. Com base nos resultados obtidos para o conjunto de teste, observa-se um desempenho melhor quando a premissa é utilizada junto à hipótese. Além disso, de modo geral, é possível observar que os resultados não foram afetados significativamente pela tradução dos dados em inglês para o português.With the Internet, it is possible to obtain news about global events regardless of the source, which means that inaccurate and even false information, called fake news, is shared. This dissemination and proliferation of fake news can cause harm and damage to people and society, highlighting the extreme importance of their identification. One way to approach this problem is by using Natural Language Processing, which encompasses computational techniques for the automatic analysis and representation of anthropological languages. For example, the detection of fake news is possible with Natural Language Inference, a sub-area of Natural Language Processing focused on checking the implication or contradiction in a pair of sentences, which can be used in this context considering reliable news as the premise and suspicious news as the hypothesis, thus, if there is a contradiction between them, the investigated news is considered false, otherwise it is labeled as true. Given this, the objective of this work is to propose a method for the automatic detection of fake news in the Portuguese language using Natural Language Inference. As no database in Portuguese uses Natural Language Inference for this application, it is possible to translate existing data into this language. Therefore, in this work, we used the database in English called FNID-FakeNewsNet. Based on the results obtained from the test set, better performance occurs with the simultaneous use of premise and hypothesis. Furthermore, it is also possible to observe that the results were not significantly affected by the translation from English to Portuguese.Universidade Estadual Paulista (Unesp)Marana, Aparecido Nilceu [UNESP]Hondo, Larissa Mayumi Barela2023-11-27T13:42:47Z2023-11-27T13:42:47Z2023-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfapplication/pdfHondo, Larissa Mayumi Barela. Detecção de fake news em português utilizando inferência de linguagem natural. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista, Unesp, Bauru, 2023.https://hdl.handle.net/11449/251490porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-07-22T16:45:11Zoai:repositorio.unesp.br:11449/251490Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T16:58:24.362477Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Detecção de fake news em português utilizando inferência de linguagem natural
Fake news detection in portuguese using natural language inference
title Detecção de fake news em português utilizando inferência de linguagem natural
spellingShingle Detecção de fake news em português utilizando inferência de linguagem natural
Hondo, Larissa Mayumi Barela
Fake news
Natural language inference
Natural language processing
Inferência de linguagem natural
Processamento de linguagem natural
title_short Detecção de fake news em português utilizando inferência de linguagem natural
title_full Detecção de fake news em português utilizando inferência de linguagem natural
title_fullStr Detecção de fake news em português utilizando inferência de linguagem natural
title_full_unstemmed Detecção de fake news em português utilizando inferência de linguagem natural
title_sort Detecção de fake news em português utilizando inferência de linguagem natural
author Hondo, Larissa Mayumi Barela
author_facet Hondo, Larissa Mayumi Barela
author_role author
dc.contributor.none.fl_str_mv Marana, Aparecido Nilceu [UNESP]
dc.contributor.author.fl_str_mv Hondo, Larissa Mayumi Barela
dc.subject.por.fl_str_mv Fake news
Natural language inference
Natural language processing
Inferência de linguagem natural
Processamento de linguagem natural
topic Fake news
Natural language inference
Natural language processing
Inferência de linguagem natural
Processamento de linguagem natural
description Com o advento da Internet, é possível obter informações a partir de quaisquer fontes sobre eventos ao redor do mundo, inclusive informações imprecisas e até mesmo falsas, sendo estas chamadas de fake news. A divulgação e a proliferação de fake news podem causar prejuízos e danos seríssimos para as pessoas e para a sociedade de modo geral, salientando a extrema importância de sua identificação. Isso pode ser feito com o uso do Processamento de Linguagem Natural, que abrange técnicas computacionais para a análise automática e à representação de linguagens antropológicas. Por exemplo, a detecção de fake news pode ser feita com a Inferência de Linguagem Natural, uma sub-área do Processamento de Linguagem Natural focada na verificação da implicação ou contradição em um par de sentenças, que pode ser utilizada neste contexto considerando notícias já confirmadas como sendo verdadeiras como a premissa e uma notícia suspeita como a hipótese, dessa forma, caso haja contradição entre a hipótese e a premissa, a notícia suspeita é considerada falsa, caso contrário, ela é rotulada como verdadeira. Visto isso, o objetivo deste trabalho é propor um método de detecção automática de fake news para a língua portuguesa utilizando a Inferência de Linguagem Natural. Como não há uma base de dados em português que utilize a Inferência de Linguagem Natural para esta aplicação, é possível traduzir dados já existentes para este idioma, em vista disso, neste trabalho utilizou-se a base de dados em inglês denominada FNID-FakeNewsNet. Com base nos resultados obtidos para o conjunto de teste, observa-se um desempenho melhor quando a premissa é utilizada junto à hipótese. Além disso, de modo geral, é possível observar que os resultados não foram afetados significativamente pela tradução dos dados em inglês para o português.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-27T13:42:47Z
2023-11-27T13:42:47Z
2023-11-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv Hondo, Larissa Mayumi Barela. Detecção de fake news em português utilizando inferência de linguagem natural. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista, Unesp, Bauru, 2023.
https://hdl.handle.net/11449/251490
identifier_str_mv Hondo, Larissa Mayumi Barela. Detecção de fake news em português utilizando inferência de linguagem natural. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista, Unesp, Bauru, 2023.
url https://hdl.handle.net/11449/251490
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128727654072320