Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/243217 |
Resumo: | Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito. |
id |
UFRGS-2_7383dbcac7f93b7a09fb9c0deb5d7a93 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/243217 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Martins, Gabriel FonsecaBarone, Dante Augusto CoutoCôrtes, Eduardo Gabriel2022-07-20T04:49:17Z2022http://hdl.handle.net/10183/243217001144908Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.Due to the current situation of COVID-19 in the world, scientists and health professionals needed to develop, create, test and launch a vaccine in record time to try to control the pandemic. Vaccination has always been a topic much discussed by people. In the envi ronment of the online platform Twitter, users express their feelings, opinions and beliefs about different subjects through tweets, and the subject of vaccination would not be left out. Using machine learning techniques on a large set of data, tweets, for example, it is possible to generate a model to try to predict the opinion of users about vaccination. The study and work carried out was to use these artificial intelligence techniques, more specif ically supervised models for classification, to label and classify tweets from a large set of data into classes for or against vaccination. Then, incorporate and use sentiment analysis techniques in these tweets about vaccine and vaccination, in order to see if they have a very positive, positive, neutral, negative or very negative sentiment, and then verify that if by adding these new factors it would improve the results of the text classifier model to determine whether these tweets are in favor or against vaccination. In addition, to analyze and try to understand the main reasons for such feelings about the topic in general. There fore, an analysis was made of the context and reasons for these sentiments, showing how the five sentiments are distributed in both classes: anti-vaccine and pro-vaccine. In par ticular, it was noted that the politics are extremely intertwined with the topic of vaccines and vaccination. That there was an increase in the positivity of sentiments in relation to the year 2021 topic when compared to the year 2020 topic. And that the sentiment most expressed by the pro-vaccine classe is positive, while the anti-vaccine class is neutral. Finally, from the experiments carried out in the work, it was concluded that the method ology proposed in incorporating the sentiment analysis scores as one of the features in a state-of-the-art Linear SVC model, when using a TF-IDF score, does not advance its classification ratings significantly, however it demonstrates its current effectiveness for its intended purpose.application/pdfporInteligência artificialAprendizado de máquinaProcessamento de linguagem naturalArtificial intelligenceMachine learningNatural language processingSentiment analysisTwitterVaccinationUm estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no BrasilA study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2021Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001144908.pdf.txt001144908.pdf.txtExtracted Texttext/plain71053http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txtcac56ce2fbe8d1d9ea9b8d9dc378707dMD52ORIGINAL001144908.pdfTexto completoapplication/pdf455914http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf1fdc3b82d199fa0b8d7f4a4763dc7e1cMD5110183/2432172022-07-21 04:55:19.428032oai:www.lume.ufrgs.br:10183/243217Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2022-07-21T07:55:19Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
dc.title.alternative.en.fl_str_mv |
A study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil |
title |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
spellingShingle |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil Martins, Gabriel Fonseca Inteligência artificial Aprendizado de máquina Processamento de linguagem natural Artificial intelligence Machine learning Natural language processing Sentiment analysis Vaccination |
title_short |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
title_full |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
title_fullStr |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
title_full_unstemmed |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
title_sort |
Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil |
author |
Martins, Gabriel Fonseca |
author_facet |
Martins, Gabriel Fonseca |
author_role |
author |
dc.contributor.author.fl_str_mv |
Martins, Gabriel Fonseca |
dc.contributor.advisor1.fl_str_mv |
Barone, Dante Augusto Couto |
dc.contributor.advisor-co1.fl_str_mv |
Côrtes, Eduardo Gabriel |
contributor_str_mv |
Barone, Dante Augusto Couto Côrtes, Eduardo Gabriel |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado de máquina Processamento de linguagem natural |
topic |
Inteligência artificial Aprendizado de máquina Processamento de linguagem natural Artificial intelligence Machine learning Natural language processing Sentiment analysis Vaccination |
dc.subject.eng.fl_str_mv |
Artificial intelligence Machine learning Natural language processing Sentiment analysis Vaccination |
description |
Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-07-20T04:49:17Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/243217 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001144908 |
url |
http://hdl.handle.net/10183/243217 |
identifier_str_mv |
001144908 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf |
bitstream.checksum.fl_str_mv |
cac56ce2fbe8d1d9ea9b8d9dc378707d 1fdc3b82d199fa0b8d7f4a4763dc7e1c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br |
_version_ |
1817724723349422080 |