Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-9Q3MMZ |
Resumo: | Cada vez mais, dados extraídos de redes sociais são utilizados para a construção de novas aplicações e serviços, como plataformas para monitoramento de trânsito, identificação de surtos epidêmicos, bem como várias outras aplicações associadas à criação de cidades inteligentes, por exemplo. Entretanto, tais serviços são vulneráveis a ataques de bots - contas automatizadas - que buscam adulterar estatísticas de percepção pública postando um excessivo número de mensagens geradas automaticamente. Bots podem invalidar diversos serviços existentes, o que torna crucial entender as principais formas de ataque, bem como buscar mecanismos de defesa. Este trabalho apresenta uma ampla caracterização do comportamento de bots no Twitter. A partir de uma base de dados real contendo 19.115 bots, foram identificadas diversas características dos bots, extraídas de padrões de comportamento e de escrita de texto, que possuem alto poder discriminativo. A partir dessas características, apresentamos um método de detecção automática de bots capaz de detectar 92% deles, enquanto menos de 1% dos usuários reais são classificados erroneamente. Finalmente, realizamos um estudo sobre quais características tornam os bots mais bem sucedidos em tarefas de infiltração. Para isso, foram criados 120 socialbots no Twitter. Durante 30 dias monitoramos seu comportamento e todas suas interações com usuários da rede, assim como com 600 usuários-alvo. Durante esse período nossos bots interagiram 5.966 vezes com 2.637 usuários do Twitter. |
id |
UFMG_867edfa6934ae7c6a84bfff06524ac99 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-9Q3MMZ |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Adriano Alonso VelosoFabricio Benevenuto de SouzaFabricio Benevenuto de SouzaDorgival Olavo Guedes NetoMarco Antonio Pinheiro de CristoCarlos Alessandro Sena de Freitas2019-08-13T23:57:02Z2019-08-13T23:57:02Z2014-03-27http://hdl.handle.net/1843/ESBF-9Q3MMZCada vez mais, dados extraídos de redes sociais são utilizados para a construção de novas aplicações e serviços, como plataformas para monitoramento de trânsito, identificação de surtos epidêmicos, bem como várias outras aplicações associadas à criação de cidades inteligentes, por exemplo. Entretanto, tais serviços são vulneráveis a ataques de bots - contas automatizadas - que buscam adulterar estatísticas de percepção pública postando um excessivo número de mensagens geradas automaticamente. Bots podem invalidar diversos serviços existentes, o que torna crucial entender as principais formas de ataque, bem como buscar mecanismos de defesa. Este trabalho apresenta uma ampla caracterização do comportamento de bots no Twitter. A partir de uma base de dados real contendo 19.115 bots, foram identificadas diversas características dos bots, extraídas de padrões de comportamento e de escrita de texto, que possuem alto poder discriminativo. A partir dessas características, apresentamos um método de detecção automática de bots capaz de detectar 92% deles, enquanto menos de 1% dos usuários reais são classificados erroneamente. Finalmente, realizamos um estudo sobre quais características tornam os bots mais bem sucedidos em tarefas de infiltração. Para isso, foram criados 120 socialbots no Twitter. Durante 30 dias monitoramos seu comportamento e todas suas interações com usuários da rede, assim como com 600 usuários-alvo. Durante esse período nossos bots interagiram 5.966 vezes com 2.637 usuários do Twitter.More and more, data extracted from social networks is used to build new applications and services, such as traffic monitoring platforms, identification of epidemic outbreaks, as well as several other applications related to the creation of smart cities, for example. However, such services are vulnerable to attacks from bots - automatized accounts - seeking to tamper statistics of public perception posting an excessive number of messages generated automatically. Bots can invalidate many existing services, which makes it crucial to understand the main forms attacks and to seek defense mechanisms. This work presents a wide characterization of the behavior of bots on Twitter. From a real data set containing 19,115 bots, several characteristics of bots were identified, extracted from behavior and writing patterns, that have discriminative power. From these features, we present an automatic detection method capable to detect 92% of the bots while only less than 1% of real users are misclassified. In addition, we conducted a study on which characteristics makes a bot most successful in infiltration tasks. For this study we created 120 socialbots on Twitter. During 30 days we monitored their behavior and interactions with all network users, as well as 600 target users. During this period our bots had 5,966 interactions with 2,637 Twitter users.Universidade Federal de Minas GeraisUFMGRedes de relações sociaisAprendizado do computadorComputaçãoRedes de computadores Medidas de segurançaBotsRedes sociaisTwitterAprendizado de máquinaBots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALcarlosalessandrosena.pdfapplication/pdf1942974https://repositorio.ufmg.br/bitstream/1843/ESBF-9Q3MMZ/1/carlosalessandrosena.pdf04f31a390afcb6944e0ae30a56f3e5aeMD51TEXTcarlosalessandrosena.pdf.txtcarlosalessandrosena.pdf.txtExtracted texttext/plain137851https://repositorio.ufmg.br/bitstream/1843/ESBF-9Q3MMZ/2/carlosalessandrosena.pdf.txte960ed7b06b284414e6a7b46155d8137MD521843/ESBF-9Q3MMZ2019-11-14 15:36:16.539oai:repositorio.ufmg.br:1843/ESBF-9Q3MMZRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T18:36:16Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
title |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
spellingShingle |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter Carlos Alessandro Sena de Freitas Bots Redes sociais Aprendizado de máquina Redes de relações sociais Aprendizado do computador Computação Redes de computadores Medidas de segurança |
title_short |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
title_full |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
title_fullStr |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
title_full_unstemmed |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
title_sort |
Bots sociais: implicações na segurança e na credibilidade de serviços baseados no Twitter |
author |
Carlos Alessandro Sena de Freitas |
author_facet |
Carlos Alessandro Sena de Freitas |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Adriano Alonso Veloso |
dc.contributor.advisor-co1.fl_str_mv |
Fabricio Benevenuto de Souza |
dc.contributor.referee1.fl_str_mv |
Fabricio Benevenuto de Souza |
dc.contributor.referee2.fl_str_mv |
Dorgival Olavo Guedes Neto |
dc.contributor.referee3.fl_str_mv |
Marco Antonio Pinheiro de Cristo |
dc.contributor.author.fl_str_mv |
Carlos Alessandro Sena de Freitas |
contributor_str_mv |
Adriano Alonso Veloso Fabricio Benevenuto de Souza Fabricio Benevenuto de Souza Dorgival Olavo Guedes Neto Marco Antonio Pinheiro de Cristo |
dc.subject.por.fl_str_mv |
Bots Redes sociais Aprendizado de máquina |
topic |
Bots Redes sociais Aprendizado de máquina Redes de relações sociais Aprendizado do computador Computação Redes de computadores Medidas de segurança |
dc.subject.other.pt_BR.fl_str_mv |
Redes de relações sociais Aprendizado do computador Computação Redes de computadores Medidas de segurança |
description |
Cada vez mais, dados extraídos de redes sociais são utilizados para a construção de novas aplicações e serviços, como plataformas para monitoramento de trânsito, identificação de surtos epidêmicos, bem como várias outras aplicações associadas à criação de cidades inteligentes, por exemplo. Entretanto, tais serviços são vulneráveis a ataques de bots - contas automatizadas - que buscam adulterar estatísticas de percepção pública postando um excessivo número de mensagens geradas automaticamente. Bots podem invalidar diversos serviços existentes, o que torna crucial entender as principais formas de ataque, bem como buscar mecanismos de defesa. Este trabalho apresenta uma ampla caracterização do comportamento de bots no Twitter. A partir de uma base de dados real contendo 19.115 bots, foram identificadas diversas características dos bots, extraídas de padrões de comportamento e de escrita de texto, que possuem alto poder discriminativo. A partir dessas características, apresentamos um método de detecção automática de bots capaz de detectar 92% deles, enquanto menos de 1% dos usuários reais são classificados erroneamente. Finalmente, realizamos um estudo sobre quais características tornam os bots mais bem sucedidos em tarefas de infiltração. Para isso, foram criados 120 socialbots no Twitter. Durante 30 dias monitoramos seu comportamento e todas suas interações com usuários da rede, assim como com 600 usuários-alvo. Durante esse período nossos bots interagiram 5.966 vezes com 2.637 usuários do Twitter. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-03-27 |
dc.date.accessioned.fl_str_mv |
2019-08-13T23:57:02Z |
dc.date.available.fl_str_mv |
2019-08-13T23:57:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-9Q3MMZ |
url |
http://hdl.handle.net/1843/ESBF-9Q3MMZ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-9Q3MMZ/1/carlosalessandrosena.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-9Q3MMZ/2/carlosalessandrosena.pdf.txt |
bitstream.checksum.fl_str_mv |
04f31a390afcb6944e0ae30a56f3e5ae e960ed7b06b284414e6a7b46155d8137 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589559804493824 |