Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/28956 |
Resumo: | O Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade. |
id |
UFF-2_21c74938a17518e79f73d1dda78da1c6 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/28956 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimoBase de dados rotuladaBotsTwitterContas honeypotsTwitter (Site de relacionamentos)Base de dadosAlgoritmo computacionalO Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade.55 f.Yaginuma, Karina YurikoQuintanilha Kubrusly, JessicaLuisé Velozo da Costa, PatríciaPinto, Patricia Mello Marçal2023-05-22T18:25:32Z2023-05-22T18:25:32Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022.http://app.uff.br/riuff/handle/1/28956CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-05-22T18:25:36Zoai:app.uff.br:1/28956Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T10:47:42.980806Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
title |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
spellingShingle |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo Pinto, Patricia Mello Marçal Base de dados rotulada Bots Contas honeypots Twitter (Site de relacionamentos) Base de dados Algoritmo computacional |
title_short |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
title_full |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
title_fullStr |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
title_full_unstemmed |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
title_sort |
Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo |
author |
Pinto, Patricia Mello Marçal |
author_facet |
Pinto, Patricia Mello Marçal |
author_role |
author |
dc.contributor.none.fl_str_mv |
Yaginuma, Karina Yuriko Quintanilha Kubrusly, Jessica Luisé Velozo da Costa, Patrícia |
dc.contributor.author.fl_str_mv |
Pinto, Patricia Mello Marçal |
dc.subject.por.fl_str_mv |
Base de dados rotulada Bots Contas honeypots Twitter (Site de relacionamentos) Base de dados Algoritmo computacional |
topic |
Base de dados rotulada Bots Contas honeypots Twitter (Site de relacionamentos) Base de dados Algoritmo computacional |
description |
O Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-05-22T18:25:32Z 2023-05-22T18:25:32Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022. http://app.uff.br/riuff/handle/1/28956 |
identifier_str_mv |
PINTO, Patricia Mello Marçal. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Estatística)- Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2022. |
url |
http://app.uff.br/riuff/handle/1/28956 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823571645759488 |