Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo

Detalhes bibliográficos
Autor(a) principal: Pinto, Patricia Mello Marçal
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/28956
Resumo: O Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade.
id UFF-2_21c74938a17518e79f73d1dda78da1c6
oai_identifier_str oai:app.uff.br:1/28956
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimoBase de dados rotuladaBotsTwitterContas honeypotsTwitter (Site de relacionamentos)Base de dadosAlgoritmo computacionalO Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade.55 f.Yaginuma, Karina YurikoQuintanilha Kubrusly, JessicaLuisé Velozo da Costa, PatríciaPinto, Patricia Mello Marçal2023-05-22T18:25:32Z2023-05-22T18:25:32Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022.http://app.uff.br/riuff/handle/1/28956CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-05-22T18:25:36Zoai:app.uff.br:1/28956Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:47:42.980806Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
title Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
spellingShingle Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
Pinto, Patricia Mello Marçal
Base de dados rotulada
Bots
Twitter
Contas honeypots
Twitter (Site de relacionamentos)
Base de dados
Algoritmo computacional
title_short Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
title_full Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
title_fullStr Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
title_full_unstemmed Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
title_sort Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
author Pinto, Patricia Mello Marçal
author_facet Pinto, Patricia Mello Marçal
author_role author
dc.contributor.none.fl_str_mv Yaginuma, Karina Yuriko
Quintanilha Kubrusly, Jessica
Luisé Velozo da Costa, Patrícia
dc.contributor.author.fl_str_mv Pinto, Patricia Mello Marçal
dc.subject.por.fl_str_mv Base de dados rotulada
Bots
Twitter
Contas honeypots
Twitter (Site de relacionamentos)
Base de dados
Algoritmo computacional
topic Base de dados rotulada
Bots
Twitter
Contas honeypots
Twitter (Site de relacionamentos)
Base de dados
Algoritmo computacional
description O Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade.
publishDate 2023
dc.date.none.fl_str_mv 2023-05-22T18:25:32Z
2023-05-22T18:25:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022.
http://app.uff.br/riuff/handle/1/28956
identifier_str_mv PINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022.
url http://app.uff.br/riuff/handle/1/28956
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823571645759488