Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos

Detalhes bibliográficos
Autor(a) principal: Santos, Patrícia Dias dos
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFABC
Texto Completo: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176
Resumo: Orientadora: Profa. Dra. Denise Hideko Goya
id UFBC_da9f01ca9aec6a7a3e2529863234f380
oai_identifier_str oai:BDTD:126176
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversosDETECÇÃO DE POSICIONAMENTOROTULAÇÃO AUTOMÁTICAMÍDIAS SOCIAISEVENTOS POLÍTICOSUSUÁRIOS DO TWITTERTÓPICOS CONTROVERSOSOPINIÃO PÚBLICASTANCE DETECTIONAUTOMATED LABELINGSOCIAL MEDIAPOLITICAL EVENTSCONTROVERSIAL TOPICSPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientadora: Profa. Dra. Denise Hideko GoyaCoorientador: Prof. Dr. Fabrício Olivetti de FrançaTese (doutorado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André, 2023.As mídias sociais se consolidaram como uma plataforma relevante para a expressão e debate de ideias políticas nos dias de hoje. Tais plataformas proporcionam aos usuários a oportunidade de compartilhar suas opiniões, comentários e críticas sobre assuntos políticos, o que pode resultar em uma grande quantidade de dados gerados. A análise desses dados utilizando métodos computacionais e estatísticos pode ajudar a medir a opinião pública em relação a esses assuntos, fornecendo insights valiosos para as instituições governamentais, organizações e pesquisadores. A detecção de posicionamento é um processo automatizado que identifica o direcionamento de indivíduos ou grupos em relação a determinados temas, utilizando técnicas de análise de textos e aprendizado de máquina, sendo uma importante ferramenta para entender preferências e opiniões. No entanto, os métodos existentes na literatura frequentemente dependem de rotulação manual prévia e são incapazes de rotular a maioria dos usuários que participam da discussão. Além disso, diversos modelos presentes na literatura abordam cada tema de forma isolada, ignorando a possível interdependência entre eles, a qual pode ser bastante significativa em diversas aplicações e ao longo do tempo. Tendo em vista essas limitações, o objetivo principal desta tese foi o de desenvolver e avaliar um método computacional automatizado de detecção de posicionamento e rotulação de usuários do Twitter em temas políticos controversos, discutidos no Brasil, com mínima intervenção humana, independentemente do grau de participação do usuário na discussão, ao longo de determinado período de tempo e considerando a possível interdependência entre os temas. O método desenvolvido integrou abordagens computacionais não supervisionadas e minimamente supervisionadas, considerando fatores sociais como homofilia e estrutura de rede e envolveu 3 principais: (i) a adaptação de uma técnica não supervisionada de detecção de posicionamento de clusters de usuários falantes de português brasileiro do Twitter em relação a um tópico controverso e polarizado; (ii) a rotulação automática individualizada de centenas de milhares de usuários empregando uma combinação de atribuição de rótulos e cálculo de pontuação de valência; (iii) a mensuração dos graus de engajamento e equilíbrio de forma a caracterizar o comportamento dos usuários rotulados nos eventos. O método foi aplicado e obteve êxito na avaliação de três temas politicamente controversos: a CPI da Covid-19, a desconfiança sobre a segurança das urnas eletrônicas, e as eleições presidenciais brasileiras de 2022. Nossos resultados mostraram que o método proposto é bastante efetivo, tendo sido capaz de atribuir um rótulo para uma percentagem superior a 90% dos usuários das bases avaliadas. Além disso, ao analisar a dimensão temporal dos dados coletados e o posicionamento dos usuários ao longo do tempo, também foi possível caracterizar o comportamento dos indivíduos pertencentes a cada um dos grupos opostos.Social media has become a relevant platform for the expression and debate of political ideas in today's society. These platforms allow users to share their opinions, comments, and critiques on political subjects, resulting in a vast amount of generated data. Analyzing this data using computational and statistical methods can help measure public opinion on these subjects, providing valuable insights for government institutions, organizations, and researchers. Stance detection is an automated process that identifies the alignment of individuals or groups towards specific topics using text analysis and machine learning techniques, making it an essential tool for understanding preferences and opinions. However, existing methods in the literature often rely on manual labeling and fail to label the majority of users participating in the discussion. Additionally, many existing models in the literature address each topic in isolation, disregarding the potential interdependence between them, which can be significant in various applications and over time. Considering these limitations, the main objective of this thesis was to develop and evaluate an automated computational method for stance detection and labeling of Twitter users regarding controversial political topics discussed in Brazil, with minimal human intervention, regardless of the user's level of participation in the discussion, over a specific period, and considering the potential interdependence between topics. The developed method integrated unsupervised and minimally supervised computational approaches, considering social factors such as homophily and network structure. It consisted of three main steps: (i) adapting an unsupervised technique for stance detection to clusters of Brazilian Portuguese-speaking Twitter users regarding a controversial and polarized topic; (ii) individual automatic labeling of hundreds of thousands of users using a combination of label assignment and valence score calculation; (iii) measuring engagement levels and balance to characterize the behavior of labeled users in the events. The method was successfully applied and evaluated on three politically controversial topics: the COVID-19 Parliamentary Inquiry, distrust in the security of electronic voting machines, and the 2022 Brazilian presidential elections. Our results showed that the proposed method is highly effective, assigning labels to over 90% of the users in the evaluated datasets. Furthermore, by analyzing the temporal dimension of the collected data and the users' stances over time, it was also possible to characterize the behavior of individuals belonging to each opposing group.Goya, Denise HidekoFrança, Fabricio Olivetti dePenteado, Claudio Luis de CamargoReis, Julio Cesar Soares dosBecker, KarinSantos, Patrícia Dias dos2023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf140 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176&midiaext=81125Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=126176porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2024-01-22T11:13:49Zoai:BDTD:126176Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2024-01-22T11:13:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.none.fl_str_mv Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
title Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
spellingShingle Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
Santos, Patrícia Dias dos
DETECÇÃO DE POSICIONAMENTO
ROTULAÇÃO AUTOMÁTICA
MÍDIAS SOCIAIS
EVENTOS POLÍTICOS
USUÁRIOS DO TWITTER
TÓPICOS CONTROVERSOS
OPINIÃO PÚBLICA
STANCE DETECTION
AUTOMATED LABELING
SOCIAL MEDIA
POLITICAL EVENTS
CONTROVERSIAL TOPICS
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
title_short Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
title_full Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
title_fullStr Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
title_full_unstemmed Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
title_sort Detecção de posicionamento e rotulação automatizada de usuários do Twitter para análise de eventos políticos controversos
author Santos, Patrícia Dias dos
author_facet Santos, Patrícia Dias dos
author_role author
dc.contributor.none.fl_str_mv Goya, Denise Hideko
França, Fabricio Olivetti de
Penteado, Claudio Luis de Camargo
Reis, Julio Cesar Soares dos
Becker, Karin
dc.contributor.author.fl_str_mv Santos, Patrícia Dias dos
dc.subject.por.fl_str_mv DETECÇÃO DE POSICIONAMENTO
ROTULAÇÃO AUTOMÁTICA
MÍDIAS SOCIAIS
EVENTOS POLÍTICOS
USUÁRIOS DO TWITTER
TÓPICOS CONTROVERSOS
OPINIÃO PÚBLICA
STANCE DETECTION
AUTOMATED LABELING
SOCIAL MEDIA
POLITICAL EVENTS
CONTROVERSIAL TOPICS
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
topic DETECÇÃO DE POSICIONAMENTO
ROTULAÇÃO AUTOMÁTICA
MÍDIAS SOCIAIS
EVENTOS POLÍTICOS
USUÁRIOS DO TWITTER
TÓPICOS CONTROVERSOS
OPINIÃO PÚBLICA
STANCE DETECTION
AUTOMATED LABELING
SOCIAL MEDIA
POLITICAL EVENTS
CONTROVERSIAL TOPICS
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
description Orientadora: Profa. Dra. Denise Hideko Goya
publishDate 2023
dc.date.none.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126176&midiaext=81125
Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=126176
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
140 f. : il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1801502112079675392