spelling |
Virgilio Augusto Fernandes AlmeidaAdriano Alonso VelosoArtur ZivianiGiovanni Ventorim Comarela2019-08-12T12:37:29Z2019-08-12T12:37:29Z2012-06-01http://hdl.handle.net/1843/ESBF-8UZHY8Nesta dissertação estuda-se o problema de entender interações entre usuários na rede de informação Twitter. O problema é abordado em duas etapas: primeiro, é realizada uma caracterização extensiva de uma grande coleção de dados, através da qual, identifica-se por exemplo que algumas vezes os usuários passam por centenas de mensagens até encontrarem alguma que tem interesse em interagir. Estes resultados motivam a identificação de fatores que influenciam as probabilidades de respostas e compartilhamento de mensagens no Twitter. Na segunda etapa, utilizando algoritmos de aprendizado de máquina, mostra-se que alguns destes fatores podem ser utilizados para melhorar o mecanismo usual de apresentação de mensagens. Estes algoritmos são avaliados através de estudos de simulação, os quais mostram que a fração de mensagens respondidas e compartilhadas próximas ao topo da lista de mensagens dos usuários cresce em até 60%.In information networks where users send messages to one another, the issue of information overload naturally arises: which are the most important messages? In this work we study the problem of understanding the importance of messages in Twitter. We approach this problem in two stages. First, we perform an extensive characterization of a very large Twitter data set which includes all users, social relations, and messages posted from the beginning of the service up to August 2009. We show evidence that information overload is present: users sometimes have to search through hundreds of messages to find those that are interesting to reply or retweet. We then identify factors that influence user response or retweet probability: previous responses to the same tweeter, the tweeter\\\'s sending rate, the age and some basic text elements of the tweet. In our second stage, we show that some of these factors can be used to improve the ordering of tweets as presented to the user. First, by inspecting user activity over time, we construct a simple on-off model of user behavior that allows us to infer when a user is actively using Twitter. Then, we explore two methods from machine learning for ranking tweets: a Naive Bayes predictor and a Support Vector Machine classifier. We show that it is possible to reorder tweets to increase the fraction of replied or retweeted messages appearing in the first positions of the list by as much as 60%.Universidade Federal de Minas GeraisUFMGInfluência (Psicologia) Redes de relações sociaisComputaçãoRedes de relações sociaistwitterInteraçõesRedes sociais onlineUma análise de fatores que influenciam interações entre usuários do twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALgiovannicomarela.pdfapplication/pdf1689570https://repositorio.ufmg.br/bitstream/1843/ESBF-8UZHY8/1/giovannicomarela.pdf9de88a86b75b803cef2bad4b1a050090MD51TEXTgiovannicomarela.pdf.txtgiovannicomarela.pdf.txtExtracted texttext/plain134584https://repositorio.ufmg.br/bitstream/1843/ESBF-8UZHY8/2/giovannicomarela.pdf.txta7d0defd43f298a648f5195d82a7542bMD521843/ESBF-8UZHY82019-11-14 17:51:16.621oai:repositorio.ufmg.br:1843/ESBF-8UZHY8Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:51:16Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
|