Avaliação de abordagens baseadas em deep learning para a identificação de fake news

Martins, Phelipe Gonçalves

Avaliação de abordagens baseadas em deep learning para a identificação de fake news

Detalhes bibliográficos
Autor(a) principal:	Martins, Phelipe Gonçalves
Data de Publicação:	2018
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo:	http://app.uff.br/riuff/handle/1/25836
Resumo:	Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.

Metadados do item

id	UFF-2_c02890ff82b6368cd52140c88a028097
oai_identifier_str	oai:app.uff.br:1/25836
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str	2120
spelling	Avaliação de abordagens baseadas em deep learning para a identificação de fake newsAprendizado de MáquinaAprendizado de máquinaInteligência artificialFake newsMultinomia l Naive BayesSupport Vector MachineConvolutional Neural NetworkLong ShortTerm MemoryNos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.In recent years, a social phenomenon has been prominent worldwide, because of its reach and fast dissemination among people: they are called fake news. This type of news has already demonstrated in several situations the capacity it has of causing negative impacts to society. In this way, several studies have been carried out to find some viable solution to directly combat this phenomenon. Recently, the use of Aprendizado de Máquina techniques has been an interesting alternative to point out whether a given news is fake or not. However, due to a large number of algorithms in this artificial intelligence subarea, it is important that tests are performed to determine which of these are most appropriate for this task. This work follows an experimental and exploratory approach, in order to evaluate which traditional approach method (Multinomial Naive Bayes and Support Vector Machines) has better performance, which method of Deep Learning approach (Convolutional Neural Network and Long Short-Term Memory), which is a Aprendizado de Máquina subarea that is on the rise, also has better performance and which method among these two produces better results in the identification of fake news, using the ideal parameters and three databases containing one thousand, ten thousand and one hundred thousand news classified as 'FAKE' and 'REAL'. After several tests, it was verified that CNN has the best performance in all the databases, highlighting the accuracy of 97.09% and 98.39% for the ten thousand and one hundred thousand news, respectively. Still, SVM demonstrated accuracy levels below CNN, but very interesting, with values greater than or equal to 90% since the use of the term frequency-inverse document frequency. LSTM has shown that it is worth using only with the database containing one hundred thousand news with accuracy of 96.59%. As for MNB, it was found that it is not worth being used to solve the problem proposed.76 p.Viterbo Filho, JoséAndrade, Eduardo de OliveiraCarvalho, Aline Marins PaesVasconcelos, Leonardo PioMartins, Phelipe Gonçalves2022-07-26T12:25:12Z2022-07-26T12:25:12Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018http://app.uff.br/riuff/handle/1/25836CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-26T12:25:16Zoai:app.uff.br:1/25836Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:10:26.892519Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
spellingShingle	Avaliação de abordagens baseadas em deep learning para a identificação de fake news Martins, Phelipe Gonçalves Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory
title_short	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_full	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_fullStr	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_full_unstemmed	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_sort	Avaliação de abordagens baseadas em deep learning para a identificação de fake news
author	Martins, Phelipe Gonçalves
author_facet	Martins, Phelipe Gonçalves
author_role	author
dc.contributor.none.fl_str_mv	Viterbo Filho, José Andrade, Eduardo de Oliveira Carvalho, Aline Marins Paes Vasconcelos, Leonardo Pio
dc.contributor.author.fl_str_mv	Martins, Phelipe Gonçalves
dc.subject.por.fl_str_mv	Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory
topic	Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory
description	Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.
publishDate	2018
dc.date.none.fl_str_mv	2018 2022-07-26T12:25:12Z 2022-07-26T12:25:12Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018 http://app.uff.br/riuff/handle/1/25836
identifier_str_mv	MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018
url	http://app.uff.br/riuff/handle/1/25836
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1811823680184909824

Avaliação de abordagens baseadas em deep learning para a identificação de fake news

Registros relacionados