Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFABC |
Texto Completo: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176 |
Resumo: | Orientadora: Profa. Dra. Denise Hideko Goya |
id |
UFBC_da9f01ca9aec6a7a3e2529863234f380 |
---|---|
oai_identifier_str |
oai:BDTD:126176 |
network_acronym_str |
UFBC |
network_name_str |
Repositório Institucional da UFABC |
repository_id_str |
|
spelling |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversosDETECÇÃO DE POSICIONAMENTOROTULAÇÃO AUTOMÁTICAMÍDIAS SOCIAISEVENTOS POLÍTICOSUSUÁRIOS DO TWITTERTÓPICOS CONTROVERSOSOPINIÃO PÚBLICASTANCE DETECTIONAUTOMATED LABELINGSOCIAL MEDIAPOLITICAL EVENTSCONTROVERSIAL TOPICSPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientadora: Profa. Dra. Denise Hideko GoyaCoorientador: Prof. Dr. Fabrício Olivetti de FrançaTese (doutorado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André, 2023.As mídias sociais se consolidaram como uma plataforma relevante para a expressão e debate de ideias políticas nos dias de hoje. Tais plataformas proporcionam aos usuários a oportunidade de compartilhar suas opiniões, comentários e críticas sobre assuntos políticos, o que pode resultar em uma grande quantidade de dados gerados. A análise desses dados utilizando métodos computacionais e estatísticos pode ajudar a medir a opinião pública em relação a esses assuntos, fornecendo insights valiosos para as instituições governamentais, organizações e pesquisadores. A detecção de posicionamento é um processo automatizado que identifica o direcionamento de indivíduos ou grupos em relação a determinados temas, utilizando técnicas de análise de textos e aprendizado de máquina, sendo uma importante ferramenta para entender preferências e opiniões. No entanto, os métodos existentes na literatura frequentemente dependem de rotulação manual prévia e são incapazes de rotular a maioria dos usuários que participam da discussão. Além disso, diversos modelos presentes na literatura abordam cada tema de forma isolada, ignorando a possível interdependência entre eles, a qual pode ser bastante significativa em diversas aplicações e ao longo do tempo. Tendo em vista essas limitações, o objetivo principal desta tese foi o de desenvolver e avaliar um método computacional automatizado de detecção de posicionamento e rotulação de usuários do Twitter em temas políticos controversos, discutidos no Brasil, com mínima intervenção humana, independentemente do grau de participação do usuário na discussão, ao longo de determinado período de tempo e considerando a possível interdependência entre os temas. O método desenvolvido integrou abordagens computacionais não supervisionadas e minimamente supervisionadas, considerando fatores sociais como homofilia e estrutura de rede e envolveu 3 principais: (i) a adaptação de uma técnica não supervisionada de detecção de posicionamento de clusters de usuários falantes de português brasileiro do Twitter em relação a um tópico controverso e polarizado; (ii) a rotulação automática individualizada de centenas de milhares de usuários empregando uma combinação de atribuição de rótulos e cálculo de pontuação de valência; (iii) a mensuração dos graus de engajamento e equilíbrio de forma a caracterizar o comportamento dos usuários rotulados nos eventos. O método foi aplicado e obteve êxito na avaliação de três temas politicamente controversos: a CPI da Covid-19, a desconfiança sobre a segurança das urnas eletrônicas, e as eleições presidenciais brasileiras de 2022. Nossos resultados mostraram que o método proposto é bastante efetivo, tendo sido capaz de atribuir um rótulo para uma percentagem superior a 90% dos usuários das bases avaliadas. Além disso, ao analisar a dimensão temporal dos dados coletados e o posicionamento dos usuários ao longo do tempo, também foi possível caracterizar o comportamento dos indivíduos pertencentes a cada um dos grupos opostos.Social media has become a relevant platform for the expression and debate of political ideas in today's society. These platforms allow users to share their opinions, comments, and critiques on political subjects, resulting in a vast amount of generated data. Analyzing this data using computational and statistical methods can help measure public opinion on these subjects, providing valuable insights for government institutions, organizations, and researchers. Stance detection is an automated process that identifies the alignment of individuals or groups towards specific topics using text analysis and machine learning techniques, making it an essential tool for understanding preferences and opinions. However, existing methods in the literature often rely on manual labeling and fail to label the majority of users participating in the discussion. Additionally, many existing models in the literature address each topic in isolation, disregarding the potential interdependence between them, which can be significant in various applications and over time. Considering these limitations, the main objective of this thesis was to develop and evaluate an automated computational method for stance detection and labeling of Twitter users regarding controversial political topics discussed in Brazil, with minimal human intervention, regardless of the user's level of participation in the discussion, over a specific period, and considering the potential interdependence between topics. The developed method integrated unsupervised and minimally supervised computational approaches, considering social factors such as homophily and network structure. It consisted of three main steps: (i) adapting an unsupervised technique for stance detection to clusters of Brazilian Portuguese-speaking Twitter users regarding a controversial and polarized topic; (ii) individual automatic labeling of hundreds of thousands of users using a combination of label assignment and valence score calculation; (iii) measuring engagement levels and balance to characterize the behavior of labeled users in the events. The method was successfully applied and evaluated on three politically controversial topics: the COVID-19 Parliamentary Inquiry, distrust in the security of electronic voting machines, and the 2022 Brazilian presidential elections. Our results showed that the proposed method is highly effective, assigning labels to over 90% of the users in the evaluated datasets. Furthermore, by analyzing the temporal dimension of the collected data and the users' stances over time, it was also possible to characterize the behavior of individuals belonging to each opposing group.Goya, Denise HidekoFrança, Fabricio Olivetti dePenteado, Claudio Luis de CamargoReis, Julio Cesar Soares dosBecker, KarinSantos, Patrícia Dias dos2023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf140 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176&midiaext=81125Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=126176porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2024-01-22T11:13:49Zoai:BDTD:126176Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2024-01-22T11:13:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
dc.title.none.fl_str_mv |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
title |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
spellingShingle |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos Santos, Patrícia Dias dos DETECÇÃO DE POSICIONAMENTO ROTULAÇÃO AUTOMÁTICA MÍDIAS SOCIAIS EVENTOS POLÍTICOS USUÁRIOS DO TWITTER TÓPICOS CONTROVERSOS OPINIÃO PÚBLICA STANCE DETECTION AUTOMATED LABELING SOCIAL MEDIA POLITICAL EVENTS CONTROVERSIAL TOPICS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
title_short |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
title_full |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
title_fullStr |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
title_full_unstemmed |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
title_sort |
Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos |
author |
Santos, Patrícia Dias dos |
author_facet |
Santos, Patrícia Dias dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Goya, Denise Hideko França, Fabricio Olivetti de Penteado, Claudio Luis de Camargo Reis, Julio Cesar Soares dos Becker, Karin |
dc.contributor.author.fl_str_mv |
Santos, Patrícia Dias dos |
dc.subject.por.fl_str_mv |
DETECÇÃO DE POSICIONAMENTO ROTULAÇÃO AUTOMÁTICA MÍDIAS SOCIAIS EVENTOS POLÍTICOS USUÁRIOS DO TWITTER TÓPICOS CONTROVERSOS OPINIÃO PÚBLICA STANCE DETECTION AUTOMATED LABELING SOCIAL MEDIA POLITICAL EVENTS CONTROVERSIAL TOPICS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
topic |
DETECÇÃO DE POSICIONAMENTO ROTULAÇÃO AUTOMÁTICA MÍDIAS SOCIAIS EVENTOS POLÍTICOS USUÁRIOS DO TWITTER TÓPICOS CONTROVERSOS OPINIÃO PÚBLICA STANCE DETECTION AUTOMATED LABELING SOCIAL MEDIA POLITICAL EVENTS CONTROVERSIAL TOPICS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
description |
Orientadora: Profa. Dra. Denise Hideko Goya |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176 |
url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176&midiaext=81125 Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=126176 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 140 f. : il. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
instname_str |
Universidade Federal do ABC (UFABC) |
instacron_str |
UFABC |
institution |
UFABC |
reponame_str |
Repositório Institucional da UFABC |
collection |
Repositório Institucional da UFABC |
repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
repository.mail.fl_str_mv |
|
_version_ |
1801502112079675392 |