Um modelo baseado em regras para a detecção de bots no Twitter
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFVJM |
Texto Completo: | https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f |
Resumo: | O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre. |
id |
UFVJM-2_01f13cc1a46e70f9b4353aba7f54a41c |
---|---|
oai_identifier_str |
oai:acervo.ufvjm.edu.br:1/2747 |
network_acronym_str |
UFVJM-2 |
network_name_str |
Repositório Institucional da UFVJM |
repository_id_str |
2145 |
spelling |
Leite, Maria Alice Gomes LopesSantos, Caroline QueirozVillela, Maria Lúcia BentoMaia, Renato DouradoSantos, Caroline QueirozUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)Guelpeli, Marcus Vinícius Carvalho2022-02-01T14:29:40Z2022-02-01T14:29:40Z20192019-12-12LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2fO grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019.The great growth in the daily use of online social networks by society has made them important sources for studies in various fields. The data generated by these networks are now being used in research for different purposes, ranging from stock market and election forecasting, to human behavior. However, data samples extracted from these networks have become vulnerable to bot activity, automated accounts used to mislead and influence other users. Therefore, this work proposed a supervised approach to knowledge extraction from a literature database, using techniques that aim not only to classify, but to describe the main characteristics of bots on Twitter, thus generating a rule-based classification model. After the interpretation and modeling of the problem, the data were prepared by inserting, modifying, filling and deleting attributes through context information for the different Artificial Intelligence techniques. The Decision Tree built sequential conditions in natural language, demonstrating a performance of 0.97 for AUC-ROC. New rules were generated by induction based on scores in order to find conditions that were neglected by the tree. These rules were assessed by the Coverage, Confidence, and Lift metrics, and demonstrated a high discriminating power. This paper aims to contribute to the Bot Filter layer in the Oracle Framework, which, through a user-friendly interface, aims to collect Twitter data with little interference from malicious accounts. This framework is being built by the MTPLNAM Research Group and will be made available to whole community under open source license.porUFVJMA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.info:eu-repo/semantics/openAccessUm modelo baseado em regras para a detecção de bots no Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTwitterBotsBot detectionSocial networksRule inductionDetecção de botsRedes SociaisIndução de regrasreponame:Repositório Institucional da UFVJMinstname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)instacron:UFVJMTHUMBNAILmaria_alice_gomes_lopes_leite.pdf.jpgmaria_alice_gomes_lopes_leite.pdf.jpgGenerated Thumbnailimage/jpeg2582https://acervo.ufvjm.edu.br//bitstreams/66c0fc5e-1f88-4499-b40b-bbf1b3689c4d/downloadd1eb5a61d6b49856c64fde1beddf5cabMD57falseAnonymousREADORIGINALmaria_alice_gomes_lopes_leite.pdfmaria_alice_gomes_lopes_leite.pdfapplication/pdf1478382https://acervo.ufvjm.edu.br//bitstreams/d7752562-38ed-44ba-aebd-4e867549e96c/download0d7d99b9e253c67c14bd5e8b48341e1eMD51trueAnonymousREADCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849https://acervo.ufvjm.edu.br//bitstreams/fa5c73e1-e58a-4db4-a0b6-27bdbbf6aaa1/download4afdbb8c545fd630ea7db775da747b2fMD52falseAnonymousREADlicense_textlicense_texttext/html; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/a7b3e845-af95-4dd3-b27d-ef664f834ecc/downloadd41d8cd98f00b204e9800998ecf8427eMD53falseAnonymousREADlicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/c48e1a7a-466f-4bd0-9314-e0be5932e915/downloadd41d8cd98f00b204e9800998ecf8427eMD54falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-82157https://acervo.ufvjm.edu.br//bitstreams/cd38127f-6874-4280-a1db-c9fedc1f66d4/downloadc0fe10782d3e2994b7c028f47c86ff9eMD55falseAnonymousREADTEXTmaria_alice_gomes_lopes_leite.pdf.txtmaria_alice_gomes_lopes_leite.pdf.txtExtracted texttext/plain130420https://acervo.ufvjm.edu.br//bitstreams/dec77f32-bf56-41db-bf80-a46f7a47b9b5/downloadb163c089d1552290214d50cdcfebd318MD56falseAnonymousREAD1/27472024-09-12 06:21:04.592open.accessoai:acervo.ufvjm.edu.br:1/2747https://acervo.ufvjm.edu.br/Repositório InstitucionalPUBhttps://repositorio.ufvjm.edu.brrepositorio@ufvjm.edu.bropendoar:21452024-09-12T06:21:04Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKQW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSBjb25jZWRlKG0pIArDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSZXBvc2l0w7NyaW8sIGRlbm9taW5hZG8gUkkvVUZWSk0sIApvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4bykgZS9vdSBkaXN0cmlidWlyIG8gCmRvY3VtZW50byBkZXBvc2l0YWRvIGVtIGZvcm1hdG8gaW1wcmVzc28sIGVsZXRyw7RuaWNvIG91IGVtIHF1YWxxdWVyIG91dHJvIG1laW8uClZvY8OqKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvcyBWYWxlcyBkbyBKZXF1aXRpbmhvbmhhIGUgTXVjdXJpLCAKZ2VzdG9yYSBkbyBSSS9VRlZKTSwgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIGNvbnZlcnRlciBvIGFycXVpdm8gZGVwb3NpdGFkbyBhIHF1YWxxdWVyIG1laW8gb3UgCmZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KVm9jw6oocykgdGFtYsOpbSBjb25jb3JkYShtKSBxdWUgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgCmdlc3RvcmEgZG8gUkkvVUZWSk0sIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkZXDDs3NpdG8gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZS9vdSBwcmVzZXJ2YcOnw6NvLgpWb2PDqihzKSBkZWNsYXJhKG0pIHF1ZSBhIGFwcmVzZW50YcOnw6NvIGRvIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqihzKSBwb2RlKG0pIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYSBlIG5vIFRlcm1vIGRlIEF1dG9yaXphw6fDo28gYSBzZXIgZW50cmVndWUuClZvY8OqKHMpIHRhbWLDqW0gZGVjbGFyYShtKSBxdWUgbyBlbnZpbyDDqSBkZSBzZXUgY29uaGVjaW1lbnRvIGUgbsOjbyBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyAKZGUgb3V0cmEgcGVzc29hIG91IGluc3RpdHVpw6fDo28uCkNhc28gbyBkb2N1bWVudG8gYSBzZXIgZGVwb3NpdGFkbyBjb250ZW5oYSBtYXRlcmlhbCBwYXJhIG8gcXVhbCB2b2PDqihzKSBuw6NvIGRldMOpbSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgZGUgYXV0b3JhaXMsCnZvY8OqKHMpIGRlY2xhcmEobSkgcXVlIG9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBjb25jZWRlciDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbApkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSSS9VRlZKTSwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgCmRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcywgZXN0w6NvIGRldmlkYW1lbnRlIGlkZW50aWZpY2Fkb3MgZSByZWNvbmhlY2lkb3Mgbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIGFwcmVzZW50YcOnw6NvLgpDQVNPIE8gVFJBQkFMSE8gREVQT1NJVEFETyBURU5IQSBTSURPIEZJTkFOQ0lBRE8gT1UgQVBPSUFETyBQT1IgVU0gw5NSR8ODTywgUVVFIE7Dg08gQSBJTlNUSVRVScOHw4NPIERFU1RFIFJFUE9TSVTDk1JJTzogVk9Dw4ogREVDTEFSQSBURVIgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIApQRUxPUyBDT05UUkFUT1MgT1UgQUNPUkRPUy4gCk8gUkkvVUZWSk0gaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8gc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG8gZGlyZWl0byBkZSAKYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoK |
dc.title.pt_BR.fl_str_mv |
Um modelo baseado em regras para a detecção de bots no Twitter |
title |
Um modelo baseado em regras para a detecção de bots no Twitter |
spellingShingle |
Um modelo baseado em regras para a detecção de bots no Twitter Leite, Maria Alice Gomes Lopes Bots Bot detection Social networks Rule induction Detecção de bots Redes Sociais Indução de regras |
title_short |
Um modelo baseado em regras para a detecção de bots no Twitter |
title_full |
Um modelo baseado em regras para a detecção de bots no Twitter |
title_fullStr |
Um modelo baseado em regras para a detecção de bots no Twitter |
title_full_unstemmed |
Um modelo baseado em regras para a detecção de bots no Twitter |
title_sort |
Um modelo baseado em regras para a detecção de bots no Twitter |
author |
Leite, Maria Alice Gomes Lopes |
author_facet |
Leite, Maria Alice Gomes Lopes |
author_role |
author |
dc.contributor.referee.none.fl_str_mv |
Santos, Caroline Queiroz Villela, Maria Lúcia Bento Maia, Renato Dourado |
dc.contributor.advisorco.none.fl_str_mv |
Santos, Caroline Queiroz |
dc.contributor.institution.pt_BR.fl_str_mv |
Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
dc.contributor.author.fl_str_mv |
Leite, Maria Alice Gomes Lopes |
dc.contributor.advisor1.fl_str_mv |
Guelpeli, Marcus Vinícius Carvalho |
contributor_str_mv |
Guelpeli, Marcus Vinícius Carvalho |
dc.subject.keyword.en.fl_str_mv |
Twitter Bots Bot detection Social networks Rule induction |
topic |
Twitter Bots Bot detection Social networks Rule induction Detecção de bots Redes Sociais Indução de regras |
dc.subject.keyword.pt_BR.fl_str_mv |
Detecção de bots Redes Sociais Indução de regras |
description |
O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre. |
publishDate |
2019 |
dc.date.submitted.none.fl_str_mv |
2019-12-12 |
dc.date.issued.fl_str_mv |
2019 |
dc.date.accessioned.fl_str_mv |
2022-02-01T14:29:40Z |
dc.date.available.fl_str_mv |
2022-02-01T14:29:40Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019. |
dc.identifier.uri.fl_str_mv |
https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f |
identifier_str_mv |
LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019. |
url |
https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
UFVJM |
publisher.none.fl_str_mv |
UFVJM |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFVJM instname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) instacron:UFVJM |
instname_str |
Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
instacron_str |
UFVJM |
institution |
UFVJM |
reponame_str |
Repositório Institucional da UFVJM |
collection |
Repositório Institucional da UFVJM |
bitstream.url.fl_str_mv |
https://acervo.ufvjm.edu.br//bitstreams/66c0fc5e-1f88-4499-b40b-bbf1b3689c4d/download https://acervo.ufvjm.edu.br//bitstreams/d7752562-38ed-44ba-aebd-4e867549e96c/download https://acervo.ufvjm.edu.br//bitstreams/fa5c73e1-e58a-4db4-a0b6-27bdbbf6aaa1/download https://acervo.ufvjm.edu.br//bitstreams/a7b3e845-af95-4dd3-b27d-ef664f834ecc/download https://acervo.ufvjm.edu.br//bitstreams/c48e1a7a-466f-4bd0-9314-e0be5932e915/download https://acervo.ufvjm.edu.br//bitstreams/cd38127f-6874-4280-a1db-c9fedc1f66d4/download https://acervo.ufvjm.edu.br//bitstreams/dec77f32-bf56-41db-bf80-a46f7a47b9b5/download |
bitstream.checksum.fl_str_mv |
d1eb5a61d6b49856c64fde1beddf5cab 0d7d99b9e253c67c14bd5e8b48341e1e 4afdbb8c545fd630ea7db775da747b2f d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e c0fe10782d3e2994b7c028f47c86ff9e b163c089d1552290214d50cdcfebd318 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
repository.mail.fl_str_mv |
repositorio@ufvjm.edu.br |
_version_ |
1813710524691513344 |