Uma abordagem de ciência de dados para identificar fake news no âmbito político

Detalhes bibliográficos
Autor(a) principal: Kito, Marcelo Hideaki Iwata
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: https://hdl.handle.net/11449/255549
Resumo: Com o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.
id UNSP_37da5d8ea52abe77a6b07876e0e16046
oai_identifier_str oai:repositorio.unesp.br:11449/255549
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Uma abordagem de ciência de dados para identificar fake news no âmbito políticoA data science approach to identify fake news in the political sphereCiência de dadosProcessamento de linguagem naturalAprendizado de máquinaDetecção de fake newsPolíticaData scienceNatural language processingMachine learningPoliticsCom o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.With the advent of the Internet, the amount of available information has grown quickly, transforming itself over the years into a wide network of connected technologies and people. One of the many changes brought by the Internet is the ease with which a user can consume information, and even produce them. However, this accessibility has allowed deceptive information to be conveyed in a larger extent and more easily than it would be in the conventional media. This false information is being called ”fake news”, which aims to give the reader credibility, but without following the guidelines to ensure its accuracy or veracity. These ”fake news” have been getting a lot of attention, specially in the political context, but there are cases related to other topics, such as vaccination, nutrition and even the stock market, which may affect different spheres of society. In order to reduce the misinformation generated by the spread of fake news, this project sought to develop a mobile application to classify, using machine learning, the veracity of news presented to the user. The application has made use of a machine learning model development pipeline, the Python programming language and its libraries, as well as the hybrid mobile application development framework Ionic. In the first step of data collection (referred to as the ”primary data set”) web crawlers were developed to obtain data from three randomly chosen news websites. In a second step of data acquisition, a data set named ”Fake.Br corpus” was used, composed of real and fake news in Portuguese that were collected, cataloged and made available by the University of São Paulo (USP). Finally, both the application and the results obtained with the trained models are presented.Universidade Estadual Paulista (Unesp)Albino, João Pedro [UNESP]Kito, Marcelo Hideaki Iwata2024-05-09T12:59:39Z2024-05-09T12:59:39Z2019-11-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfKITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.https://hdl.handle.net/11449/255549porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-05-16T12:27:28Zoai:repositorio.unesp.br:11449/255549Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T19:36:11.766676Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Uma abordagem de ciência de dados para identificar fake news no âmbito político
A data science approach to identify fake news in the political sphere
title Uma abordagem de ciência de dados para identificar fake news no âmbito político
spellingShingle Uma abordagem de ciência de dados para identificar fake news no âmbito político
Kito, Marcelo Hideaki Iwata
Ciência de dados
Processamento de linguagem natural
Aprendizado de máquina
Detecção de fake news
Política
Data science
Natural language processing
Machine learning
Politics
title_short Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_full Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_fullStr Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_full_unstemmed Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_sort Uma abordagem de ciência de dados para identificar fake news no âmbito político
author Kito, Marcelo Hideaki Iwata
author_facet Kito, Marcelo Hideaki Iwata
author_role author
dc.contributor.none.fl_str_mv Albino, João Pedro [UNESP]
dc.contributor.author.fl_str_mv Kito, Marcelo Hideaki Iwata
dc.subject.por.fl_str_mv Ciência de dados
Processamento de linguagem natural
Aprendizado de máquina
Detecção de fake news
Política
Data science
Natural language processing
Machine learning
Politics
topic Ciência de dados
Processamento de linguagem natural
Aprendizado de máquina
Detecção de fake news
Política
Data science
Natural language processing
Machine learning
Politics
description Com o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-12
2024-05-09T12:59:39Z
2024-05-09T12:59:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv KITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.
https://hdl.handle.net/11449/255549
identifier_str_mv KITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.
url https://hdl.handle.net/11449/255549
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129095208271872