Avaliação de abordagens baseadas em deep learning para a identificação de fake news
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/25836 |
Resumo: | Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto. |
id |
UFF-2_c02890ff82b6368cd52140c88a028097 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/25836 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Avaliação de abordagens baseadas em deep learning para a identificação de fake newsAprendizado de MáquinaAprendizado de máquinaInteligência artificialFake newsMultinomia l Naive BayesSupport Vector MachineConvolutional Neural NetworkLong ShortTerm MemoryNos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.In recent years, a social phenomenon has been prominent worldwide, because of its reach and fast dissemination among people: they are called fake news. This type of news has already demonstrated in several situations the capacity it has of causing negative impacts to society. In this way, several studies have been carried out to find some viable solution to directly combat this phenomenon. Recently, the use of Aprendizado de Máquina techniques has been an interesting alternative to point out whether a given news is fake or not. However, due to a large number of algorithms in this artificial intelligence subarea, it is important that tests are performed to determine which of these are most appropriate for this task. This work follows an experimental and exploratory approach, in order to evaluate which traditional approach method (Multinomial Naive Bayes and Support Vector Machines) has better performance, which method of Deep Learning approach (Convolutional Neural Network and Long Short-Term Memory), which is a Aprendizado de Máquina subarea that is on the rise, also has better performance and which method among these two produces better results in the identification of fake news, using the ideal parameters and three databases containing one thousand, ten thousand and one hundred thousand news classified as 'FAKE' and 'REAL'. After several tests, it was verified that CNN has the best performance in all the databases, highlighting the accuracy of 97.09% and 98.39% for the ten thousand and one hundred thousand news, respectively. Still, SVM demonstrated accuracy levels below CNN, but very interesting, with values greater than or equal to 90% since the use of the term frequency-inverse document frequency. LSTM has shown that it is worth using only with the database containing one hundred thousand news with accuracy of 96.59%. As for MNB, it was found that it is not worth being used to solve the problem proposed.76 p.Viterbo Filho, JoséAndrade, Eduardo de OliveiraCarvalho, Aline Marins PaesVasconcelos, Leonardo PioMartins, Phelipe Gonçalves2022-07-26T12:25:12Z2022-07-26T12:25:12Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfMARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018http://app.uff.br/riuff/handle/1/25836CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-26T12:25:16Zoai:app.uff.br:1/25836Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:10:26.892519Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
title |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
spellingShingle |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news Martins, Phelipe Gonçalves Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory |
title_short |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
title_full |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
title_fullStr |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
title_full_unstemmed |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
title_sort |
Avaliação de abordagens baseadas em deep learning para a identificação de fake news |
author |
Martins, Phelipe Gonçalves |
author_facet |
Martins, Phelipe Gonçalves |
author_role |
author |
dc.contributor.none.fl_str_mv |
Viterbo Filho, José Andrade, Eduardo de Oliveira Carvalho, Aline Marins Paes Vasconcelos, Leonardo Pio |
dc.contributor.author.fl_str_mv |
Martins, Phelipe Gonçalves |
dc.subject.por.fl_str_mv |
Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory |
topic |
Aprendizado de Máquina Aprendizado de máquina Inteligência artificial Fake news Multinomia l Naive Bayes Support Vector Machine Convolutional Neural Network Long ShortTerm Memory |
description |
Nos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 2022-07-26T12:25:12Z 2022-07-26T12:25:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018 http://app.uff.br/riuff/handle/1/25836 |
identifier_str_mv |
MARTINS, Phelipe Gonçalves. Avaliação de abordagens baseadas em deep learning para a identificação de fake news. 2018. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal Fluminense, Escola de Engenharia, Niterói, 2018 |
url |
http://app.uff.br/riuff/handle/1/25836 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823680184909824 |