Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil

Detalhes bibliográficos
Autor(a) principal: Silva, Adeilson Souza da
Data de Publicação: 2015
Outros Autores: http://lattes.cnpq.br/7277627592187255
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo: https://tede.ufam.edu.br/handle/tede/6930
Resumo: O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.
id UFAM_249b08ecd43527a6c96ce6db14985beb
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/6930
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str 6592
spelling Detectando comportamento automatizado nos tópicos de tendência do Twitter no BrasilDetecting automated behavior in Twitter trend topics in BrazilTweetsTópicos de TendênciaEntropiaAprendizagem de MáquinaTrend TopicsEntropyMachine LearningCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOO crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.The growth in the number of users in social networks, especially Twitter, become themselves susceptible to creation and propagation of automated posts. On Twitter, the Trend Topics list represents the most talked subjects in a particular region and can be misused by automated accounts. Then, it is necessary to understand and study how these users behave in order to create measures to combat them and ensure that published data have credibility. Using a real database collected from the Twitter Trend Topics in Brazil, from December 2013 to June 2014, with 2.853,822 accounts and 11,294,861 tweets, a methodology to detect automated behavior in Trend Topics was proposed. For this, we studied several text characteristics and user behavior to identify attributes capable of distiguish human users and automated users. Also were proposed six (6) new features based on the concept of entropy. Using this set of attributes with ma-chine learning algorithms for supervised classification, it was possible to detect 92 % of automated accounts in the database used and thus get an insight into the behavior of these users.FAPEAM - Fundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaFeitosa, Eduardo Luzeirohttp://lattes.cnpq.br/5939944067207881Souto, Eduardo James Pereirahttp://lattes.cnpq.br/3875301617975895Batista, Daniel Macêdohttp://lattes.cnpq.br/2934786440085983Silva, Adeilson Souza dahttp://lattes.cnpq.br/72776275921872552019-02-07T17:42:00Z2015-09-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.https://tede.ufam.edu.br/handle/tede/6930porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-02-08T05:03:52Zoai:https://tede.ufam.edu.br/handle/:tede/6930Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-02-08T05:03:52Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
Detecting automated behavior in Twitter trend topics in Brazil
title Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
spellingShingle Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
Silva, Adeilson Souza da
Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_full Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_fullStr Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_full_unstemmed Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
title_sort Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
author Silva, Adeilson Souza da
author_facet Silva, Adeilson Souza da
http://lattes.cnpq.br/7277627592187255
author_role author
author2 http://lattes.cnpq.br/7277627592187255
author2_role author
dc.contributor.none.fl_str_mv Feitosa, Eduardo Luzeiro
http://lattes.cnpq.br/5939944067207881
Souto, Eduardo James Pereira
http://lattes.cnpq.br/3875301617975895
Batista, Daniel Macêdo
http://lattes.cnpq.br/2934786440085983
dc.contributor.author.fl_str_mv Silva, Adeilson Souza da
http://lattes.cnpq.br/7277627592187255
dc.subject.por.fl_str_mv Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Tweets
Tópicos de Tendência
Entropia
Aprendizagem de Máquina
Trend Topics
Entropy
Machine Learning
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.
publishDate 2015
dc.date.none.fl_str_mv 2015-09-25
2019-02-07T17:42:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.
https://tede.ufam.edu.br/handle/tede/6930
identifier_str_mv SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.
url https://tede.ufam.edu.br/handle/tede/6930
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1800234116865589248