Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições

Silva, Ana Valeria Vieira da

Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições

Detalhes bibliográficos
Autor(a) principal:	Silva, Ana Valeria Vieira da
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10362/118278
Resumo:	As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.

Metadados do item

id	RCAP_5ca947591ffe284c719f3fdc4396887d
oai_identifier_str	oai:run.unl.pt:10362/118278
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleiçõesanômalasdetecçãomachine learningAutoencoderrede socialAs redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.Social networks can be used in an environment of political campaigning or elections as an information channel for its users. Twitter’s social network has been used as a political platform in several elections around the world and its political campaigns are coordinated by accounts with human or non-human users. It is essential to discern the activity of normal anomalous accounts, as the information propagated by the network can have several objectives, including disinformation. The disinformation caused by anomalous accounts is more likely to reach the social network due to the high number of accounts that can be linked to this same objective. This dissertation uses two models to detect anomalous accounts based on the SVM one-class and Autoencoder Ensembles algorithms. The study used real data as recently elections occurred in Brazil in 2018 and Portugal in 2019. The features of Twitter’s social network were important in the analysis of the user's profile and were selected using the Recursive Feature Elimination technique. Only information from previously known normal accounts was used to train unsupervised learning models, which allows the models to be reused in other elections for any country, this being an innovation proposed by this work. Both models made it possible to detect anomalous accounts in the test data, presenting overall good performance in their results. The Autoencoder Ensembles was developed by the ensembles method from the value of the reconstruction error with training in sequence. From the detection of anomalous accounts, clusters were created and it is possible to verify that there is a difference in the political discourse published by anomalous accounts through tweets in the elections that took place in Brazil and Portugal. The actual data was taken from the Twitter developer API, which enabled the access to active accounts during the electoral period in 2018 in Brazil and 2019 in Portugal. The objective of this dissertation was to contribute to the growing study in the field of Information Systems that use machine learning techniques and neural networks to detect real or anomalous accounts, in addition to visualizing the clusters generated from these latter.Krippahl, LudwigRUNSilva, Ana Valeria Vieira da2021-05-25T14:24:59Z2021-022021-02-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/118278porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T05:01:13Zoai:run.unl.pt:10362/118278Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:43:51.612510Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
spellingShingle	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições Silva, Ana Valeria Vieira da anômalas detecção machine learning Autoencoder rede social
title_short	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_full	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_fullStr	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_full_unstemmed	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
title_sort	Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições
author	Silva, Ana Valeria Vieira da
author_facet	Silva, Ana Valeria Vieira da
author_role	author
dc.contributor.none.fl_str_mv	Krippahl, Ludwig RUN
dc.contributor.author.fl_str_mv	Silva, Ana Valeria Vieira da
dc.subject.por.fl_str_mv	anômalas detecção machine learning Autoencoder rede social
topic	anômalas detecção machine learning Autoencoder rede social
description	As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.
publishDate	2021
dc.date.none.fl_str_mv	2021-05-25T14:24:59Z 2021-02 2021-02-01T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10362/118278
url	http://hdl.handle.net/10362/118278
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799138047151833088

Detecção de contas anômalas e influência em redes sociais na propaganda política e em eleições

Registros relacionados