Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil

Detalhes bibliográficos
Autor(a) principal: Martins, Gabriel Fonseca
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/243217
Resumo: Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.
id UFRGS-2_7383dbcac7f93b7a09fb9c0deb5d7a93
oai_identifier_str oai:www.lume.ufrgs.br:10183/243217
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Martins, Gabriel FonsecaBarone, Dante Augusto CoutoCôrtes, Eduardo Gabriel2022-07-20T04:49:17Z2022http://hdl.handle.net/10183/243217001144908Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.Due to the current situation of COVID-19 in the world, scientists and health professionals needed to develop, create, test and launch a vaccine in record time to try to control the pandemic. Vaccination has always been a topic much discussed by people. In the envi ronment of the online platform Twitter, users express their feelings, opinions and beliefs about different subjects through tweets, and the subject of vaccination would not be left out. Using machine learning techniques on a large set of data, tweets, for example, it is possible to generate a model to try to predict the opinion of users about vaccination. The study and work carried out was to use these artificial intelligence techniques, more specif ically supervised models for classification, to label and classify tweets from a large set of data into classes for or against vaccination. Then, incorporate and use sentiment analysis techniques in these tweets about vaccine and vaccination, in order to see if they have a very positive, positive, neutral, negative or very negative sentiment, and then verify that if by adding these new factors it would improve the results of the text classifier model to determine whether these tweets are in favor or against vaccination. In addition, to analyze and try to understand the main reasons for such feelings about the topic in general. There fore, an analysis was made of the context and reasons for these sentiments, showing how the five sentiments are distributed in both classes: anti-vaccine and pro-vaccine. In par ticular, it was noted that the politics are extremely intertwined with the topic of vaccines and vaccination. That there was an increase in the positivity of sentiments in relation to the year 2021 topic when compared to the year 2020 topic. And that the sentiment most expressed by the pro-vaccine classe is positive, while the anti-vaccine class is neutral. Finally, from the experiments carried out in the work, it was concluded that the method ology proposed in incorporating the sentiment analysis scores as one of the features in a state-of-the-art Linear SVC model, when using a TF-IDF score, does not advance its classification ratings significantly, however it demonstrates its current effectiveness for its intended purpose.application/pdfporInteligência artificialAprendizado de máquinaProcessamento de linguagem naturalArtificial intelligenceMachine learningNatural language processingSentiment analysisTwitterVaccinationUm estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no BrasilA study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2021Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001144908.pdf.txt001144908.pdf.txtExtracted Texttext/plain71053http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txtcac56ce2fbe8d1d9ea9b8d9dc378707dMD52ORIGINAL001144908.pdfTexto completoapplication/pdf455914http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf1fdc3b82d199fa0b8d7f4a4763dc7e1cMD5110183/2432172022-07-21 04:55:19.428032oai:www.lume.ufrgs.br:10183/243217Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2022-07-21T07:55:19Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
dc.title.alternative.en.fl_str_mv A study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil
title Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
spellingShingle Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
Martins, Gabriel Fonseca
Inteligência artificial
Aprendizado de máquina
Processamento de linguagem natural
Artificial intelligence
Machine learning
Natural language processing
Sentiment analysis
Twitter
Vaccination
title_short Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_full Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_fullStr Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_full_unstemmed Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
title_sort Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
author Martins, Gabriel Fonseca
author_facet Martins, Gabriel Fonseca
author_role author
dc.contributor.author.fl_str_mv Martins, Gabriel Fonseca
dc.contributor.advisor1.fl_str_mv Barone, Dante Augusto Couto
dc.contributor.advisor-co1.fl_str_mv Côrtes, Eduardo Gabriel
contributor_str_mv Barone, Dante Augusto Couto
Côrtes, Eduardo Gabriel
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado de máquina
Processamento de linguagem natural
topic Inteligência artificial
Aprendizado de máquina
Processamento de linguagem natural
Artificial intelligence
Machine learning
Natural language processing
Sentiment analysis
Twitter
Vaccination
dc.subject.eng.fl_str_mv Artificial intelligence
Machine learning
Natural language processing
Sentiment analysis
Twitter
Vaccination
description Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-07-20T04:49:17Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/243217
dc.identifier.nrb.pt_BR.fl_str_mv 001144908
url http://hdl.handle.net/10183/243217
identifier_str_mv 001144908
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/243217/2/001144908.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/243217/1/001144908.pdf
bitstream.checksum.fl_str_mv cac56ce2fbe8d1d9ea9b8d9dc378707d
1fdc3b82d199fa0b8d7f4a4763dc7e1c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1817724723349422080