Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/118278 |
Resumo: | As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas. |
id |
RCAP_5ca947591ffe284c719f3fdc4396887d |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/118278 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleiçõesanômalasdetecçãomachine learningAutoencoderrede socialAs redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.Social networks can be used in an environment of political campaigning or elections as an information channel for its users. Twitter’s social network has been used as a political platform in several elections around the world and its political campaigns are coordinated by accounts with human or non-human users. It is essential to discern the activity of normal anomalous accounts, as the information propagated by the network can have several objectives, including disinformation. The disinformation caused by anomalous accounts is more likely to reach the social network due to the high number of accounts that can be linked to this same objective. This dissertation uses two models to detect anomalous accounts based on the SVM one-class and Autoencoder Ensembles algorithms. The study used real data as recently elections occurred in Brazil in 2018 and Portugal in 2019. The features of Twitter’s social network were important in the analysis of the user's profile and were selected using the Recursive Feature Elimination technique. Only information from previously known normal accounts was used to train unsupervised learning models, which allows the models to be reused in other elections for any country, this being an innovation proposed by this work. Both models made it possible to detect anomalous accounts in the test data, presenting overall good performance in their results. The Autoencoder Ensembles was developed by the ensembles method from the value of the reconstruction error with training in sequence. From the detection of anomalous accounts, clusters were created and it is possible to verify that there is a difference in the political discourse published by anomalous accounts through tweets in the elections that took place in Brazil and Portugal. The actual data was taken from the Twitter developer API, which enabled the access to active accounts during the electoral period in 2018 in Brazil and 2019 in Portugal. The objective of this dissertation was to contribute to the growing study in the field of Information Systems that use machine learning techniques and neural networks to detect real or anomalous accounts, in addition to visualizing the clusters generated from these latter.Krippahl, LudwigRUNSilva, Ana Valeria Vieira da2021-05-25T14:24:59Z2021-022021-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/118278porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:01:13Zoai:run.unl.pt:10362/118278Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:43:51.612510Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
title |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
spellingShingle |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições Silva, Ana Valeria Vieira da anômalas detecção machine learning Autoencoder rede social |
title_short |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
title_full |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
title_fullStr |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
title_full_unstemmed |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
title_sort |
Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições |
author |
Silva, Ana Valeria Vieira da |
author_facet |
Silva, Ana Valeria Vieira da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Krippahl, Ludwig RUN |
dc.contributor.author.fl_str_mv |
Silva, Ana Valeria Vieira da |
dc.subject.por.fl_str_mv |
anômalas detecção machine learning Autoencoder rede social |
topic |
anômalas detecção machine learning Autoencoder rede social |
description |
As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-05-25T14:24:59Z 2021-02 2021-02-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/118278 |
url |
http://hdl.handle.net/10362/118278 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799138047151833088 |