Avaliação de abordagens baseadas em deep learning para a identificação de fake news

Detalhes bibliográficos
Autor(a) principal: Martins, Phelipe Gonçalves
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25836
Resumo: Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.
id UFF-2_c02890ff82b6368cd52140c88a028097
oai_identifier_str oai:app.uff.br:1/25836
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Avaliação de abordagens baseadas em deep learning para a identificação de fake newsAprendizado de MáquinaAprendizado de máquinaInteligência artificialFake newsMultinomia l Naive BayesSupport Vector MachineConvolutional Neural NetworkLong ShortTerm MemoryNos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.In recent years, a social phenomenon has been prominent worldwide, because of its reach and fast dissemination among people: they are called fake news. This type of news has already demonstrated in several situations the capacity it has of causing negative impacts to society. In this way, several studies have been carried out to find some viable solution to directly combat this phenomenon. Recently, the use of Aprendizado de Máquina techniques has been an interesting alternative to point out whether a given news is fake or not. However, due to a large number of algorithms in this artificial intelligence subarea, it is important that tests are performed to determine which of these are most appropriate for this task. This work follows an experimental and exploratory approach, in order to evaluate which traditional approach method (Multinomial Naive Bayes and Support Vector Machines) has better performance, which method of Deep Learning approach (Convolutional Neural Network and Long Short-Term Memory), which is a Aprendizado de Máquina subarea that is on the rise, also has better performance and which method among these two produces better results in the identification of fake news, using the ideal parameters and three databases containing one thousand, ten thousand and one hundred thousand news classified as 'FAKE' and 'REAL'. After several tests, it was verified that CNN has the best performance in all the databases, highlighting the accuracy of 97.09% and 98.39% for the ten thousand and one hundred thousand news, respectively. Still, SVM demonstrated accuracy levels below CNN, but very interesting, with values greater than or equal to 90% since the use of the term frequency-inverse document frequency. LSTM has shown that it is worth using only with the database containing one hundred thousand news with accuracy of 96.59%. As for MNB, it was found that it is not worth being used to solve the problem proposed.76 p.Viterbo Filho, JoséAndrade, Eduardo de OliveiraCarvalho, Aline Marins PaesVasconcelos, Leonardo PioMartins, Phelipe Gonçalves2022-07-26T12:25:12Z2022-07-26T12:25:12Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018http://app.uff.br/riuff/handle/1/25836CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-26T12:25:16Zoai:app.uff.br:1/25836Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:10:26.892519Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title Avaliação de abordagens baseadas em deep learning para a identificação de fake news
spellingShingle Avaliação de abordagens baseadas em deep learning para a identificação de fake news
Martins, Phelipe Gonçalves
Aprendizado de Máquina
Aprendizado de máquina
Inteligência artificial
Fake news
Multinomia l Naive Bayes
Support Vector Machine
Convolutional Neural Network
Long ShortTerm Memory
title_short Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_full Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_fullStr Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_full_unstemmed Avaliação de abordagens baseadas em deep learning para a identificação de fake news
title_sort Avaliação de abordagens baseadas em deep learning para a identificação de fake news
author Martins, Phelipe Gonçalves
author_facet Martins, Phelipe Gonçalves
author_role author
dc.contributor.none.fl_str_mv Viterbo Filho, José
Andrade, Eduardo de Oliveira
Carvalho, Aline Marins Paes
Vasconcelos, Leonardo Pio
dc.contributor.author.fl_str_mv Martins, Phelipe Gonçalves
dc.subject.por.fl_str_mv Aprendizado de Máquina
Aprendizado de máquina
Inteligência artificial
Fake news
Multinomia l Naive Bayes
Support Vector Machine
Convolutional Neural Network
Long ShortTerm Memory
topic Aprendizado de Máquina
Aprendizado de máquina
Inteligência artificial
Fake news
Multinomia l Naive Bayes
Support Vector Machine
Convolutional Neural Network
Long ShortTerm Memory
description Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.
publishDate 2018
dc.date.none.fl_str_mv 2018
2022-07-26T12:25:12Z
2022-07-26T12:25:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018
http://app.uff.br/riuff/handle/1/25836
identifier_str_mv MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018
url http://app.uff.br/riuff/handle/1/25836
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823680184909824