Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil

Martins, Gabriel Fonseca

Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil

Detalhes bibliográficos
Autor(a) principal:	Martins, Gabriel Fonseca
Data de Publicação:	2022
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRGS
Texto Completo:	http://hdl.handle.net/10183/243217
Resumo:	Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.

Metadados do item

id	UFRGS-2_7383dbcac7f93b7a09fb9c0deb5d7a93
oai_identifier_str	oai:www.lume.ufrgs.br:10183/243217
network_acronym_str	UFRGS-2
network_name_str	Repositório Institucional da UFRGS
repository_id_str
spelling	Martins, Gabriel FonsecaBarone, Dante Augusto CoutoCôrtes, Eduardo Gabriel2022-07-20T04:49:17Z2022http://hdl.handle.net/10183/243217001144908Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.Due to the current situation of COVID-19 in the world, scientists and health professionals needed to develop, create, test and launch a vaccine in record time to try to control the pandemic. Vaccination has always been a topic much discussed by people. In the envi ronment of the online platform Twitter, users express their feelings, opinions and beliefs about different subjects through tweets, and the subject of vaccination would not be left out. Using machine learning techniques on a large set of data, tweets, for example, it is possible to generate a model to try to predict the opinion of users about vaccination. The study and work carried out was to use these artificial intelligence techniques, more specif ically supervised models for classification, to label and classify tweets from a large set of data into classes for or against vaccination. Then, incorporate and use sentiment analysis techniques in these tweets about vaccine and vaccination, in order to see if they have a very positive, positive, neutral, negative or very negative sentiment, and then verify that if by adding these new factors it would improve the results of the text classifier model to determine whether these tweets are in favor or against vaccination. In addition, to analyze and try to understand the main reasons for such feelings about the topic in general. There fore, an analysis was made of the context and reasons for these sentiments, showing how the five sentiments are distributed in both classes: anti-vaccine and pro-vaccine. In par ticular, it was noted that the politics are extremely intertwined with the topic of vaccines and vaccination. That there was an increase in the positivity of sentiments in relation to the year 2021 topic when compared to the year 2020 topic. And that the sentiment most expressed by the pro-vaccine classe is positive, while the anti-vaccine class is neutral. Finally, from the experiments carried out in the work, it was concluded that the method ology proposed in incorporating the sentiment analysis scores as one of the features in a state-of-the-art Linear SVC model, when using a TF-IDF score, does not advance its classification ratings significantly, however it demonstrates its current effectiveness for its intended purpose.application/pdfporInteligência artificialAprendizado de máquinaProcessamento de linguagem naturalArtificial intelligenceMachine learningNatural language processingSentiment analysisTwitterVaccinationUm estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no BrasilA study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2021Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001144908.pdf.txt001144908.pdf.txtExtracted Texttext/plain71053http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txtcac56ce2fbe8d1d9ea9b8d9dc378707dMD52ORIGINAL001144908.pdfTexto completoapplication/pdf455914http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf1fdc3b82d199fa0b8d7f4a4763dc7e1cMD5110183/2432172022-07-21 04:55:19.428032oai:www.lume.ufrgs.br:10183/243217Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2022-07-21T07:55:19Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
dc.title.alternative.en.fl_str_mv	A study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil
title	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
spellingShingle	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil Martins, Gabriel Fonseca Inteligência artificial Aprendizado de máquina Processamento de linguagem natural Artificial intelligence Machine learning Natural language processing Sentiment analysis Twitter Vaccination
title_short	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_full	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_fullStr	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_full_unstemmed	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_sort	Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
author	Martins, Gabriel Fonseca
author_facet	Martins, Gabriel Fonseca
author_role	author
dc.contributor.author.fl_str_mv	Martins, Gabriel Fonseca
dc.contributor.advisor1.fl_str_mv	Barone, Dante Augusto Couto
dc.contributor.advisor-co1.fl_str_mv	Côrtes, Eduardo Gabriel
contributor_str_mv	Barone, Dante Augusto Couto Côrtes, Eduardo Gabriel
dc.subject.por.fl_str_mv	Inteligência artificial Aprendizado de máquina Processamento de linguagem natural
topic	Inteligência artificial Aprendizado de máquina Processamento de linguagem natural Artificial intelligence Machine learning Natural language processing Sentiment analysis Twitter Vaccination
dc.subject.eng.fl_str_mv	Artificial intelligence Machine learning Natural language processing Sentiment analysis Twitter Vaccination
description	Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.
publishDate	2022
dc.date.accessioned.fl_str_mv	2022-07-20T04:49:17Z
dc.date.issued.fl_str_mv	2022
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/243217
dc.identifier.nrb.pt_BR.fl_str_mv	001144908
url	http://hdl.handle.net/10183/243217
identifier_str_mv	001144908
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Repositório Institucional da UFRGS
collection	Repositório Institucional da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf
bitstream.checksum.fl_str_mv	cac56ce2fbe8d1d9ea9b8d9dc378707d 1fdc3b82d199fa0b8d7f4a4763dc7e1c
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br
_version_	1817724723349422080

Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil

Registros relacionados