Uma abordagem de ciência de dados para identificar fake news no âmbito político

Kito, Marcelo Hideaki Iwata

Uma abordagem de ciência de dados para identificar fake news no âmbito político

Detalhes bibliográficos
Autor(a) principal:	Kito, Marcelo Hideaki Iwata
Data de Publicação:	2019
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UNESP
Texto Completo:	https://hdl.handle.net/11449/255549
Resumo:	Com o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.

Metadados do item

id	UNSP_37da5d8ea52abe77a6b07876e0e16046
oai_identifier_str	oai:repositorio.unesp.br:11449/255549
network_acronym_str	UNSP
network_name_str	Repositório Institucional da UNESP
repository_id_str	2946
spelling	Uma abordagem de ciência de dados para identificar fake news no âmbito políticoA data science approach to identify fake news in the political sphereCiência de dadosProcessamento de linguagem naturalAprendizado de máquinaDetecção de fake newsPolíticaData scienceNatural language processingMachine learningPoliticsCom o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.With the advent of the Internet, the amount of available information has grown quickly, transforming itself over the years into a wide network of connected technologies and people. One of the many changes brought by the Internet is the ease with which a user can consume information, and even produce them. However, this accessibility has allowed deceptive information to be conveyed in a larger extent and more easily than it would be in the conventional media. This false information is being called ”fake news”, which aims to give the reader credibility, but without following the guidelines to ensure its accuracy or veracity. These ”fake news” have been getting a lot of attention, specially in the political context, but there are cases related to other topics, such as vaccination, nutrition and even the stock market, which may affect different spheres of society. In order to reduce the misinformation generated by the spread of fake news, this project sought to develop a mobile application to classify, using machine learning, the veracity of news presented to the user. The application has made use of a machine learning model development pipeline, the Python programming language and its libraries, as well as the hybrid mobile application development framework Ionic. In the first step of data collection (referred to as the ”primary data set”) web crawlers were developed to obtain data from three randomly chosen news websites. In a second step of data acquisition, a data set named ”Fake.Br corpus” was used, composed of real and fake news in Portuguese that were collected, cataloged and made available by the University of São Paulo (USP). Finally, both the application and the results obtained with the trained models are presented.Universidade Estadual Paulista (Unesp)Albino, João Pedro [UNESP]Kito, Marcelo Hideaki Iwata2024-05-09T12:59:39Z2024-05-09T12:59:39Z2019-11-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfKITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.https://hdl.handle.net/11449/255549porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-05-16T12:27:28Zoai:repositorio.unesp.br:11449/255549Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T19:36:11.766676Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv	Uma abordagem de ciência de dados para identificar fake news no âmbito político A data science approach to identify fake news in the political sphere
title	Uma abordagem de ciência de dados para identificar fake news no âmbito político
spellingShingle	Uma abordagem de ciência de dados para identificar fake news no âmbito político Kito, Marcelo Hideaki Iwata Ciência de dados Processamento de linguagem natural Aprendizado de máquina Detecção de fake news Política Data science Natural language processing Machine learning Politics
title_short	Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_full	Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_fullStr	Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_full_unstemmed	Uma abordagem de ciência de dados para identificar fake news no âmbito político
title_sort	Uma abordagem de ciência de dados para identificar fake news no âmbito político
author	Kito, Marcelo Hideaki Iwata
author_facet	Kito, Marcelo Hideaki Iwata
author_role	author
dc.contributor.none.fl_str_mv	Albino, João Pedro [UNESP]
dc.contributor.author.fl_str_mv	Kito, Marcelo Hideaki Iwata
dc.subject.por.fl_str_mv	Ciência de dados Processamento de linguagem natural Aprendizado de máquina Detecção de fake news Política Data science Natural language processing Machine learning Politics
topic	Ciência de dados Processamento de linguagem natural Aprendizado de máquina Detecção de fake news Política Data science Natural language processing Machine learning Politics
description	Com o advento da Internet, a quantidade de informações disponível cresceu muito rapidamente transformando-se, ao longo dos anos, em uma ampla rede de tecnologias e pessoas conectadas. Uma das muitas mudanças provocadas pela Internet é a facilidade com a qual um usuário consegue consumir informações, e até mesmo produzi-las. Entretanto, essa acessibilidade permitiu a veiculação de informações enganosas numa proporção maior e mais facilmente do que se faria em veículos convencionais. A essas informações falsas tem sido atribuído o termo ”fake news”, que procuram passar credibilidade ao leitor, mas sem seguir as diretrizes para garantir a precisão ou a veracidade das mesmas. Essas ”fake news” têm obtido bastante atenção, principalmente no âmbito político, mas existem casos relacionados a outros tópicos, como vacinação, nutrição e mesmo no mercado de ações, podendo afetar diferentes esferas da sociedade. Com o intuito de atenuar a desinformação gerada pela propagação de ”fake news”, este projeto buscou desenvolver um aplicativo móvel com o intuito de classificar, utilizando-se de aprendizado de máquina, a veracidade das notícias fornecidas ao usuário. O aplicativo utilizou-se do fluxo de desenvolvimento de um modelo de aprendizado de máquina, da ferramenta Python e suas bibliotecas, assim como o framework de desenvolvimento híbrido Ionic. Na primeira etapa de coleta de dados (referenciado como ”conjunto de dados primário”) foram desenvolvidos rastreadores de rede (web crawlers) para obter dados de três sites de notícias escolhidos ao acaso. Em uma segunda etapa de aquisição de dados, utilizou-se o conjunto de dados ”Fake.Br corpus”, composto de notícias reais e falsas em português e recolhidas, catalogadas e disponibilizadas pela Universidade de São Paulo (USP). Por fim, são apresentados o aplicativo e os resultados obtidos com os modelos treinados.
publishDate	2019
dc.date.none.fl_str_mv	2019-11-12 2024-05-09T12:59:39Z 2024-05-09T12:59:39Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	KITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019. https://hdl.handle.net/11449/255549
identifier_str_mv	KITO, Marcelo Hideaki Iwata. Uma abordagem de ciência de dados para identificar fake news no âmbito. 2029. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2019.
url	https://hdl.handle.net/11449/255549
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP
instname_str	Universidade Estadual Paulista (UNESP)
instacron_str	UNESP
institution	UNESP
reponame_str	Repositório Institucional da UNESP
collection	Repositório Institucional da UNESP
repository.name.fl_str_mv	Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_	1808129095208271872

Uma abordagem de ciência de dados para identificar fake news no âmbito político

Registros relacionados