Um modelo baseado em regras para a detecção de bots no Twitter

Detalhes bibliográficos
Autor(a) principal: Leite, Maria Alice Gomes Lopes
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFVJM
Texto Completo: https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f
Resumo: O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.
id UFVJM-2_01f13cc1a46e70f9b4353aba7f54a41c
oai_identifier_str oai:acervo.ufvjm.edu.br:1/2747
network_acronym_str UFVJM-2
network_name_str Repositório Institucional da UFVJM
repository_id_str 2145
spelling Leite, Maria Alice Gomes LopesSantos, Caroline QueirozVillela, Maria Lúcia BentoMaia, Renato DouradoSantos, Caroline QueirozUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)Guelpeli, Marcus Vinícius Carvalho2022-02-01T14:29:40Z2022-02-01T14:29:40Z20192019-12-12LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2fO grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019.The great growth in the daily use of online social networks by society has made them important sources for studies in various fields. The data generated by these networks are now being used in research for different purposes, ranging from stock market and election forecasting, to human behavior. However, data samples extracted from these networks have become vulnerable to bot activity, automated accounts used to mislead and influence other users. Therefore, this work proposed a supervised approach to knowledge extraction from a literature database, using techniques that aim not only to classify, but to describe the main characteristics of bots on Twitter, thus generating a rule-based classification model. After the interpretation and modeling of the problem, the data were prepared by inserting, modifying, filling and deleting attributes through context information for the different Artificial Intelligence techniques. The Decision Tree built sequential conditions in natural language, demonstrating a performance of 0.97 for AUC-ROC. New rules were generated by induction based on scores in order to find conditions that were neglected by the tree. These rules were assessed by the Coverage, Confidence, and Lift metrics, and demonstrated a high discriminating power. This paper aims to contribute to the Bot Filter layer in the Oracle Framework, which, through a user-friendly interface, aims to collect Twitter data with little interference from malicious accounts. This framework is being built by the MTPLNAM Research Group and will be made available to whole community under open source license.porUFVJMA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.info:eu-repo/semantics/openAccessUm modelo baseado em regras para a detecção de bots no Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTwitterBotsBot detectionSocial networksRule inductionDetecção de botsRedes SociaisIndução de regrasreponame:Repositório Institucional da UFVJMinstname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)instacron:UFVJMTHUMBNAILmaria_alice_gomes_lopes_leite.pdf.jpgmaria_alice_gomes_lopes_leite.pdf.jpgGenerated Thumbnailimage/jpeg2582https://acervo.ufvjm.edu.br//bitstreams/66c0fc5e-1f88-4499-b40b-bbf1b3689c4d/downloadd1eb5a61d6b49856c64fde1beddf5cabMD57falseAnonymousREADORIGINALmaria_alice_gomes_lopes_leite.pdfmaria_alice_gomes_lopes_leite.pdfapplication/pdf1478382https://acervo.ufvjm.edu.br//bitstreams/d7752562-38ed-44ba-aebd-4e867549e96c/download0d7d99b9e253c67c14bd5e8b48341e1eMD51trueAnonymousREADCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849https://acervo.ufvjm.edu.br//bitstreams/fa5c73e1-e58a-4db4-a0b6-27bdbbf6aaa1/download4afdbb8c545fd630ea7db775da747b2fMD52falseAnonymousREADlicense_textlicense_texttext/html; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/a7b3e845-af95-4dd3-b27d-ef664f834ecc/downloadd41d8cd98f00b204e9800998ecf8427eMD53falseAnonymousREADlicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80https://acervo.ufvjm.edu.br//bitstreams/c48e1a7a-466f-4bd0-9314-e0be5932e915/downloadd41d8cd98f00b204e9800998ecf8427eMD54falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-82157https://acervo.ufvjm.edu.br//bitstreams/cd38127f-6874-4280-a1db-c9fedc1f66d4/downloadc0fe10782d3e2994b7c028f47c86ff9eMD55falseAnonymousREADTEXTmaria_alice_gomes_lopes_leite.pdf.txtmaria_alice_gomes_lopes_leite.pdf.txtExtracted texttext/plain130420https://acervo.ufvjm.edu.br//bitstreams/dec77f32-bf56-41db-bf80-a46f7a47b9b5/downloadb163c089d1552290214d50cdcfebd318MD56falseAnonymousREAD1/27472024-09-12 06:21:04.592open.accessoai:acervo.ufvjm.edu.br:1/2747https://acervo.ufvjm.edu.br/Repositório InstitucionalPUBhttps://repositorio.ufvjm.edu.brrepositorio@ufvjm.edu.bropendoar:21452024-09-12T06:21:04Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKQW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSBjb25jZWRlKG0pIArDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSZXBvc2l0w7NyaW8sIGRlbm9taW5hZG8gUkkvVUZWSk0sIApvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4bykgZS9vdSBkaXN0cmlidWlyIG8gCmRvY3VtZW50byBkZXBvc2l0YWRvIGVtIGZvcm1hdG8gaW1wcmVzc28sIGVsZXRyw7RuaWNvIG91IGVtIHF1YWxxdWVyIG91dHJvIG1laW8uClZvY8OqKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvcyBWYWxlcyBkbyBKZXF1aXRpbmhvbmhhIGUgTXVjdXJpLCAKZ2VzdG9yYSBkbyBSSS9VRlZKTSwgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIGNvbnZlcnRlciBvIGFycXVpdm8gZGVwb3NpdGFkbyBhIHF1YWxxdWVyIG1laW8gb3UgCmZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KVm9jw6oocykgdGFtYsOpbSBjb25jb3JkYShtKSBxdWUgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgCmdlc3RvcmEgZG8gUkkvVUZWSk0sIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkZXDDs3NpdG8gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZS9vdSBwcmVzZXJ2YcOnw6NvLgpWb2PDqihzKSBkZWNsYXJhKG0pIHF1ZSBhIGFwcmVzZW50YcOnw6NvIGRvIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqihzKSBwb2RlKG0pIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYSBlIG5vIFRlcm1vIGRlIEF1dG9yaXphw6fDo28gYSBzZXIgZW50cmVndWUuClZvY8OqKHMpIHRhbWLDqW0gZGVjbGFyYShtKSBxdWUgbyBlbnZpbyDDqSBkZSBzZXUgY29uaGVjaW1lbnRvIGUgbsOjbyBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyAKZGUgb3V0cmEgcGVzc29hIG91IGluc3RpdHVpw6fDo28uCkNhc28gbyBkb2N1bWVudG8gYSBzZXIgZGVwb3NpdGFkbyBjb250ZW5oYSBtYXRlcmlhbCBwYXJhIG8gcXVhbCB2b2PDqihzKSBuw6NvIGRldMOpbSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgZGUgYXV0b3JhaXMsCnZvY8OqKHMpIGRlY2xhcmEobSkgcXVlIG9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBjb25jZWRlciDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbApkb3MgVmFsZXMgZG8gSmVxdWl0aW5ob25oYSBlIE11Y3VyaSwgZ2VzdG9yYSBkbyBSSS9VRlZKTSwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgCmRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcywgZXN0w6NvIGRldmlkYW1lbnRlIGlkZW50aWZpY2Fkb3MgZSByZWNvbmhlY2lkb3Mgbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIGFwcmVzZW50YcOnw6NvLgpDQVNPIE8gVFJBQkFMSE8gREVQT1NJVEFETyBURU5IQSBTSURPIEZJTkFOQ0lBRE8gT1UgQVBPSUFETyBQT1IgVU0gw5NSR8ODTywgUVVFIE7Dg08gQSBJTlNUSVRVScOHw4NPIERFU1RFIFJFUE9TSVTDk1JJTzogVk9Dw4ogREVDTEFSQSBURVIgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIApQRUxPUyBDT05UUkFUT1MgT1UgQUNPUkRPUy4gCk8gUkkvVUZWSk0gaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8gc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG8gZGlyZWl0byBkZSAKYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoK
dc.title.pt_BR.fl_str_mv Um modelo baseado em regras para a detecção de bots no Twitter
title Um modelo baseado em regras para a detecção de bots no Twitter
spellingShingle Um modelo baseado em regras para a detecção de bots no Twitter
Leite, Maria Alice Gomes Lopes
Twitter
Bots
Bot detection
Social networks
Rule induction
Detecção de bots
Redes Sociais
Indução de regras
title_short Um modelo baseado em regras para a detecção de bots no Twitter
title_full Um modelo baseado em regras para a detecção de bots no Twitter
title_fullStr Um modelo baseado em regras para a detecção de bots no Twitter
title_full_unstemmed Um modelo baseado em regras para a detecção de bots no Twitter
title_sort Um modelo baseado em regras para a detecção de bots no Twitter
author Leite, Maria Alice Gomes Lopes
author_facet Leite, Maria Alice Gomes Lopes
author_role author
dc.contributor.referee.none.fl_str_mv Santos, Caroline Queiroz
Villela, Maria Lúcia Bento
Maia, Renato Dourado
dc.contributor.advisorco.none.fl_str_mv Santos, Caroline Queiroz
dc.contributor.institution.pt_BR.fl_str_mv Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
dc.contributor.author.fl_str_mv Leite, Maria Alice Gomes Lopes
dc.contributor.advisor1.fl_str_mv Guelpeli, Marcus Vinícius Carvalho
contributor_str_mv Guelpeli, Marcus Vinícius Carvalho
dc.subject.keyword.en.fl_str_mv Twitter
Bots
Bot detection
Social networks
Rule induction
topic Twitter
Bots
Bot detection
Social networks
Rule induction
Detecção de bots
Redes Sociais
Indução de regras
dc.subject.keyword.pt_BR.fl_str_mv Detecção de bots
Redes Sociais
Indução de regras
description O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-12-12
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2022-02-01T14:29:40Z
dc.date.available.fl_str_mv 2022-02-01T14:29:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.
dc.identifier.uri.fl_str_mv https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f
identifier_str_mv LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.
url https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv UFVJM
publisher.none.fl_str_mv UFVJM
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFVJM
instname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
instacron:UFVJM
instname_str Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
instacron_str UFVJM
institution UFVJM
reponame_str Repositório Institucional da UFVJM
collection Repositório Institucional da UFVJM
bitstream.url.fl_str_mv https://acervo.ufvjm.edu.br//bitstreams/66c0fc5e-1f88-4499-b40b-bbf1b3689c4d/download
https://acervo.ufvjm.edu.br//bitstreams/d7752562-38ed-44ba-aebd-4e867549e96c/download
https://acervo.ufvjm.edu.br//bitstreams/fa5c73e1-e58a-4db4-a0b6-27bdbbf6aaa1/download
https://acervo.ufvjm.edu.br//bitstreams/a7b3e845-af95-4dd3-b27d-ef664f834ecc/download
https://acervo.ufvjm.edu.br//bitstreams/c48e1a7a-466f-4bd0-9314-e0be5932e915/download
https://acervo.ufvjm.edu.br//bitstreams/cd38127f-6874-4280-a1db-c9fedc1f66d4/download
https://acervo.ufvjm.edu.br//bitstreams/dec77f32-bf56-41db-bf80-a46f7a47b9b5/download
bitstream.checksum.fl_str_mv d1eb5a61d6b49856c64fde1beddf5cab
0d7d99b9e253c67c14bd5e8b48341e1e
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
c0fe10782d3e2994b7c028f47c86ff9e
b163c089d1552290214d50cdcfebd318
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)
repository.mail.fl_str_mv repositorio@ufvjm.edu.br
_version_ 1813710524691513344