Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições

Detalhes bibliográficos
Autor(a) principal: Silva, Ana Valeria Vieira da
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10362/118278
Resumo: As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.
id RCAP_5ca947591ffe284c719f3fdc4396887d
oai_identifier_str oai:run.unl.pt:10362/118278
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleiçõesanômalasdetecçãomachine learningAutoencoderrede socialAs redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.Social networks can be used in an environment of political campaigning or elections as an information channel for its users. Twitter’s social network has been used as a political platform in several elections around the world and its political campaigns are coordinated by accounts with human or non-human users. It is essential to discern the activity of normal anomalous accounts, as the information propagated by the network can have several objectives, including disinformation. The disinformation caused by anomalous accounts is more likely to reach the social network due to the high number of accounts that can be linked to this same objective. This dissertation uses two models to detect anomalous accounts based on the SVM one-class and Autoencoder Ensembles algorithms. The study used real data as recently elections occurred in Brazil in 2018 and Portugal in 2019. The features of Twitter’s social network were important in the analysis of the user's profile and were selected using the Recursive Feature Elimination technique. Only information from previously known normal accounts was used to train unsupervised learning models, which allows the models to be reused in other elections for any country, this being an innovation proposed by this work. Both models made it possible to detect anomalous accounts in the test data, presenting overall good performance in their results. The Autoencoder Ensembles was developed by the ensembles method from the value of the reconstruction error with training in sequence. From the detection of anomalous accounts, clusters were created and it is possible to verify that there is a difference in the political discourse published by anomalous accounts through tweets in the elections that took place in Brazil and Portugal. The actual data was taken from the Twitter developer API, which enabled the access to active accounts during the electoral period in 2018 in Brazil and 2019 in Portugal. The objective of this dissertation was to contribute to the growing study in the field of Information Systems that use machine learning techniques and neural networks to detect real or anomalous accounts, in addition to visualizing the clusters generated from these latter.Krippahl, LudwigRUNSilva, Ana Valeria Vieira da2021-05-25T14:24:59Z2021-022021-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/118278porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:01:13Zoai:run.unl.pt:10362/118278Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:43:51.612510Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
spellingShingle Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
Silva, Ana Valeria Vieira da
anômalas
detecção
machine learning
Autoencoder
rede social
title_short Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_full Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_fullStr Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_full_unstemmed Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_sort Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
author Silva, Ana Valeria Vieira da
author_facet Silva, Ana Valeria Vieira da
author_role author
dc.contributor.none.fl_str_mv Krippahl, Ludwig
RUN
dc.contributor.author.fl_str_mv Silva, Ana Valeria Vieira da
dc.subject.por.fl_str_mv anômalas
detecção
machine learning
Autoencoder
rede social
topic anômalas
detecção
machine learning
Autoencoder
rede social
description As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-25T14:24:59Z
2021-02
2021-02-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/118278
url http://hdl.handle.net/10362/118278
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799138047151833088