Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/30900 |
Resumo: | Social networks are prevalent virtual environments, being present in the daily lives of millions of people around the world. There are several networks, each with their specializations, such as sharing videos, images, or text. Twitter is one of the most popular, focused on sharing short texts, the so-called tweets. This course conclusion paper aims to perform a sentiment analysis regarding the Brazilian Social Security Reform, approved in 2019. The sentiment analysis combines machine learning concepts, natural language processing, linguistics, and textual analysis. It aims to extract opinions from texts through a classification traditionally related to a “positive” or “negative” feeling. In this context, we conducted a set of experiments to determine the impact of different pre-processing techniques, an important step that aims to improve the classification’s performance. We perform a comparison of four machine learning algorithms used to classify the texts: Naïve Bayes, Logistic Regression, Support Vector Machines (SVM), and Random Forest. The results of the pre-processing revealed that different techniques could affect each algorithm differently. The algorithms also obtained performances considered adequate, with Naïve Bayes having the lowest accuracy, 84% with the application of text pre-processing techniques. Analyzing the classification results, Naïve Bayes was the one that classified more as positive, while the others as neutral. Comparisons were also made between the classifications’ results, showing that the most similar was Logistic Regression and SVM, with 91% of equal classifications. The most distinctive was Naïve Bayes and Random Forest, at only 46% equal ratings. |
id |
UFU_f264a2241ea5a6053060687e4b7b6c8e |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/30900 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019Sentiments analysis on Twitter about the reform of Social Security in 2019Análise de SentimentosAprendizagem de MáquinaTwitterReforma da PrevidênciaPré-processamentoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSocial networks are prevalent virtual environments, being present in the daily lives of millions of people around the world. There are several networks, each with their specializations, such as sharing videos, images, or text. Twitter is one of the most popular, focused on sharing short texts, the so-called tweets. This course conclusion paper aims to perform a sentiment analysis regarding the Brazilian Social Security Reform, approved in 2019. The sentiment analysis combines machine learning concepts, natural language processing, linguistics, and textual analysis. It aims to extract opinions from texts through a classification traditionally related to a “positive” or “negative” feeling. In this context, we conducted a set of experiments to determine the impact of different pre-processing techniques, an important step that aims to improve the classification’s performance. We perform a comparison of four machine learning algorithms used to classify the texts: Naïve Bayes, Logistic Regression, Support Vector Machines (SVM), and Random Forest. The results of the pre-processing revealed that different techniques could affect each algorithm differently. The algorithms also obtained performances considered adequate, with Naïve Bayes having the lowest accuracy, 84% with the application of text pre-processing techniques. Analyzing the classification results, Naïve Bayes was the one that classified more as positive, while the others as neutral. Comparisons were also made between the classifications’ results, showing that the most similar was Logistic Regression and SVM, with 91% of equal classifications. The most distinctive was Naïve Bayes and Random Forest, at only 46% equal ratings.Trabalho de Conclusão de Curso (Graduação)Redes sociais são ambientes virtuais muito populares, sendo presente no cotidiano de milhões de pessoas ao redor do mundo. Existem diversas redes cada uma com suas especializações, como compartilhamento de vídeos, imagens ou texto. O Twitter é uma entre as mais populares, focada em compartilhamento de textos curtos, os chamados de tweets. Este trabalho de conclusão de curso visa analisar sentimentos em relação à proposta da Reforma da Previdência no Brasil, aprovada em 2019. A análise de sentimentos une conceitos de aprendizagem de máquinas, processamento de linguagem natural, linguísticas e análise textual e visa extrair opiniões de textos através de uma classificação, tradicionalmente relacionado a um sentimento “positivo” ou “negativo”. Nesse contexto, foram realizados experimentos para apurar o impacto de diferentes técnicas de pré-processamento, uma importante etapa que procura melhorar o desempenho da classificação. Também foram feitas comparações de quatro algoritmos de aprendizagem de máquina, utilizados para classificar os textos: Naïve Bayes, Regressão Logística, Máquinas de Vetores de Suporte (SVM) e Floresta Aleatória. Os resultados do pré-processamento revelaram que diferentes técnicas podem afetar de diferentes formas cada algoritmo. Os algoritmos também obtiveram desempenhos considerados adequados, com o Naïve Bayes tendo a acurácia mais baixa, cerca de 84% com a aplicação de técnicas de pré-processamento de texto. Analisando os resultados das classificações, o Naïve Bayes foi o que classificou mais como positivo, já os demais como neutros. Também foram feitas comparações entre resultados das classificações, demonstrando que os mais semelhantes foram o Regressão Logística e o SVM, com 91% de classificações iguais. Já os mais distintos foram o Naïve Bayes e o Floresta Aleatória com apenas 46% de classificações iguais.Universidade Federal de UberlândiaBrasilSistemas de InformaçãoGabriel, Paulo Henrique Ribeirohttp://lattes.cnpq.br/3181954061121790Paiva, Elaine Ribeiro de Fariahttp://lattes.cnpq.br/8238524390290386Miani, Rodrigo Sancheshttp://lattes.cnpq.br/2992074747740327Ricci, Rafael Denipote2020-12-30T21:07:35Z2020-12-30T21:07:35Z2020-12-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfRICCI, Rafael Denipote. Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019. 2020. 70 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2020.https://repositorio.ufu.br/handle/123456789/30900porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2020-12-31T06:15:41Zoai:repositorio.ufu.br:123456789/30900Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2020-12-31T06:15:41Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 Sentiments analysis on Twitter about the reform of Social Security in 2019 |
title |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
spellingShingle |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 Ricci, Rafael Denipote Análise de Sentimentos Aprendizagem de Máquina Reforma da Previdência Pré-processamento CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
title_full |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
title_fullStr |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
title_full_unstemmed |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
title_sort |
Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019 |
author |
Ricci, Rafael Denipote |
author_facet |
Ricci, Rafael Denipote |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gabriel, Paulo Henrique Ribeiro http://lattes.cnpq.br/3181954061121790 Paiva, Elaine Ribeiro de Faria http://lattes.cnpq.br/8238524390290386 Miani, Rodrigo Sanches http://lattes.cnpq.br/2992074747740327 |
dc.contributor.author.fl_str_mv |
Ricci, Rafael Denipote |
dc.subject.por.fl_str_mv |
Análise de Sentimentos Aprendizagem de Máquina Reforma da Previdência Pré-processamento CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Análise de Sentimentos Aprendizagem de Máquina Reforma da Previdência Pré-processamento CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Social networks are prevalent virtual environments, being present in the daily lives of millions of people around the world. There are several networks, each with their specializations, such as sharing videos, images, or text. Twitter is one of the most popular, focused on sharing short texts, the so-called tweets. This course conclusion paper aims to perform a sentiment analysis regarding the Brazilian Social Security Reform, approved in 2019. The sentiment analysis combines machine learning concepts, natural language processing, linguistics, and textual analysis. It aims to extract opinions from texts through a classification traditionally related to a “positive” or “negative” feeling. In this context, we conducted a set of experiments to determine the impact of different pre-processing techniques, an important step that aims to improve the classification’s performance. We perform a comparison of four machine learning algorithms used to classify the texts: Naïve Bayes, Logistic Regression, Support Vector Machines (SVM), and Random Forest. The results of the pre-processing revealed that different techniques could affect each algorithm differently. The algorithms also obtained performances considered adequate, with Naïve Bayes having the lowest accuracy, 84% with the application of text pre-processing techniques. Analyzing the classification results, Naïve Bayes was the one that classified more as positive, while the others as neutral. Comparisons were also made between the classifications’ results, showing that the most similar was Logistic Regression and SVM, with 91% of equal classifications. The most distinctive was Naïve Bayes and Random Forest, at only 46% equal ratings. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-30T21:07:35Z 2020-12-30T21:07:35Z 2020-12-07 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
RICCI, Rafael Denipote. Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019. 2020. 70 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2020. https://repositorio.ufu.br/handle/123456789/30900 |
identifier_str_mv |
RICCI, Rafael Denipote. Análise de sentimentos no Twitter sobre a Reforma da Previdência no ano de 2019. 2020. 70 f. Trabalho de Conclusão de Curso (Graduação em Estatística) – Universidade Federal de Uberlândia, Uberlândia, 2020. |
url |
https://repositorio.ufu.br/handle/123456789/30900 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Sistemas de Informação |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Sistemas de Informação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1805569716783153152 |