Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Outros Autores: | |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFAM |
Texto Completo: | https://tede.ufam.edu.br/handle/tede/6930 |
Resumo: | O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários. |
id |
UFAM_249b08ecd43527a6c96ce6db14985beb |
---|---|
oai_identifier_str |
oai:https://tede.ufam.edu.br/handle/:tede/6930 |
network_acronym_str |
UFAM |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository_id_str |
6592 |
spelling |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no BrasilDetecting automated behavior in Twitter trend topics in BrazilTweetsTópicos de TendênciaEntropiaAprendizagem de MáquinaTrend TopicsEntropyMachine LearningCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOO crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.The growth in the number of users in social networks, especially Twitter, become themselves susceptible to creation and propagation of automated posts. On Twitter, the Trend Topics list represents the most talked subjects in a particular region and can be misused by automated accounts. Then, it is necessary to understand and study how these users behave in order to create measures to combat them and ensure that published data have credibility. Using a real database collected from the Twitter Trend Topics in Brazil, from December 2013 to June 2014, with 2.853,822 accounts and 11,294,861 tweets, a methodology to detect automated behavior in Trend Topics was proposed. For this, we studied several text characteristics and user behavior to identify attributes capable of distiguish human users and automated users. Also were proposed six (6) new features based on the concept of entropy. Using this set of attributes with ma-chine learning algorithms for supervised classification, it was possible to detect 92 % of automated accounts in the database used and thus get an insight into the behavior of these users.FAPEAM - Fundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaFeitosa, Eduardo Luzeirohttp://lattes.cnpq.br/5939944067207881Souto, Eduardo James Pereirahttp://lattes.cnpq.br/3875301617975895Batista, Daniel Macêdohttp://lattes.cnpq.br/2934786440085983Silva, Adeilson Souza dahttp://lattes.cnpq.br/72776275921872552019-02-07T17:42:00Z2015-09-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.https://tede.ufam.edu.br/handle/tede/6930porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-02-08T05:03:52Zoai:https://tede.ufam.edu.br/handle/:tede/6930Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-02-08T05:03:52Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false |
dc.title.none.fl_str_mv |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil Detecting automated behavior in Twitter trend topics in Brazil |
title |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
spellingShingle |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil Silva, Adeilson Souza da Tweets Tópicos de Tendência Entropia Aprendizagem de Máquina Trend Topics Entropy Machine Learning CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
title_short |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
title_full |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
title_fullStr |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
title_full_unstemmed |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
title_sort |
Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil |
author |
Silva, Adeilson Souza da |
author_facet |
Silva, Adeilson Souza da http://lattes.cnpq.br/7277627592187255 |
author_role |
author |
author2 |
http://lattes.cnpq.br/7277627592187255 |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Feitosa, Eduardo Luzeiro http://lattes.cnpq.br/5939944067207881 Souto, Eduardo James Pereira http://lattes.cnpq.br/3875301617975895 Batista, Daniel Macêdo http://lattes.cnpq.br/2934786440085983 |
dc.contributor.author.fl_str_mv |
Silva, Adeilson Souza da http://lattes.cnpq.br/7277627592187255 |
dc.subject.por.fl_str_mv |
Tweets Tópicos de Tendência Entropia Aprendizagem de Máquina Trend Topics Entropy Machine Learning CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
topic |
Tweets Tópicos de Tendência Entropia Aprendizagem de Máquina Trend Topics Entropy Machine Learning CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
description |
O crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-09-25 2019-02-07T17:42:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015. https://tede.ufam.edu.br/handle/tede/6930 |
identifier_str_mv |
SILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015. |
url |
https://tede.ufam.edu.br/handle/tede/6930 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
publisher.none.fl_str_mv |
Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
instname_str |
Universidade Federal do Amazonas (UFAM) |
instacron_str |
UFAM |
institution |
UFAM |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
collection |
Biblioteca Digital de Teses e Dissertações da UFAM |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM) |
repository.mail.fl_str_mv |
ddbc@ufam.edu.br||ddbc@ufam.edu.br |
_version_ |
1800234116865589248 |