Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural

Detalhes bibliográficos
Autor(a) principal: Moura, Teógenes
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: https://bdm.unb.br/handle/10483/28923
Resumo: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
id UNB-2_6ba65d969895a48217931c1f1dcbe5b5
oai_identifier_str oai:bdm.unb.br:10483/28923
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Moura, TeógenesGonçalves, Vinicius PereiraMOURA, Teógenes. Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural. 2019. 68 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019.https://bdm.unb.br/handle/10483/28923Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.A discussão acerca dos efeitos das tecnologias digitais sobre a democracia passaram a receber muita atenção desdde o advento das mídias sociais e dispositivos móveis. Neste documento, nós entramos na discussão sobre mecanismos de busca e seus efeitos políticos, cuja importância aumentou significativamente após a eleição norte-americana de 2016. Nosso estudo foca na eleição geral brasileira de 2018,um processo bastante conturbado que levou a eleição de um Presidente de extrema direita. O artigo primeiro descreve o processo de aquisição dos dados. Nós construímos um processo de treinamento-busca- coleta no qual criamos contas avatares com a intenção de representar, o mais fielmente possível, eleitores dos espectros políticos da esquerda e da direita. Então, utilizamos um processo automatizado para fazer buscas de modo que o Google pudesse entender as diferenças entre perfis. Por fim, repetidamente coletamos os resultados mostrados a cada usuário durante o período da eleição, baseados numa lista geral de termos de buscas, que resultou num banco de dados contendo aproximadamente 300 mil URLs. Utilizamos o algoritmo Word2Vec, uma técnica que nos permite observar quais palavras e frases estão mais proximamente associados a tópicos sensíveis da eleição, como ’Fernando Haddad’ e ’Jair Bolsonaro’. Coletamos uma base de 2 milhões de palavras e conseguimos demonstrar o uso de retórica violenta em ambos os lados da disucssão, com palavras como ’medo’ e ’agressão’ aparecendo relacionadas a Fernando Haddad, enquanto ’inimigo’ e ’nazista’ aparecem próximas a Jair Bolsonaro, o que demonstra uma eleição extremamente polarizada.Submitted by Luanna Maia (luanna@bce.unb.br) on 2021-10-15T17:20:40Z No. of bitstreams: 1 2019_TeogenesMoura_tcc.pdf: 2230926 bytes, checksum: 6dea895d329d3b69f8dc31a57ba82756 (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2021-10-15T17:20:50Z (GMT) No. of bitstreams: 1 2019_TeogenesMoura_tcc.pdf: 2230926 bytes, checksum: 6dea895d329d3b69f8dc31a57ba82756 (MD5)Made available in DSpace on 2021-10-15T17:20:50Z (GMT). No. of bitstreams: 1 2019_TeogenesMoura_tcc.pdf: 2230926 bytes, checksum: 6dea895d329d3b69f8dc31a57ba82756 (MD5)The discussion around the effects of digital technology on democracy gained the spotlight since the rise of social media and mobile devices. In this paper, we shed light into the discussion around search engines and their political effects, which gained a lot of momentum after the 2016 US Election. Our study focuses on the Brazilian General Election of 2018, a highly disruptive electoral process, which led to the election of an extreme right-wing President. This paper first describes the process of gathering the data. We set up a training-searching-collecting framework in which we created avatar accounts intending to represent, as accurately as possible, the digital behavior of voters belonging to the right and left spectrums of the political debate. Then, we used an automated to approach to make queries on their behalf so that Google understands the differences between the profiles. Lastly, we repeatedly collected the results shown by Google to each user during the election period, based on a common list of search terms which result in 300 thousand URL records in our database. We then analyzed the titles of the URLs shown by Google, as well as the contents of the texts of each link in the results. We used the Word2Vec algorithm, a Natural Language Processing technique which allows us to determine words and phrases closely associated with key topics in the election, such as the main Presidential candidates’ names: Fernando Haddad and Jair Bolsonaro. We collect a dataset of more than 2M words and are able to demonstrate the use of violent rhetoric on both sides of the discussion, with words such as ’fear’ and ’agression’ appearing closely related to Fernando Haddad, while ’enemy’ and ’nazist’ are seen next to Jair Bolsonaro, which are results that clearly demonstrate an extremely polarized election process.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessEleiçõesFerramentas de busca na WebPesquisa na InternetProcessamento eletrônico de dadosMonitorando e entendendo a eleição brasileira por meio de processamento de linguagem naturalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2021-10-15T17:20:50Z2021-10-15T17:20:50Z2019-07-04porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/28923/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2019_TeogenesMoura_tcc.pdf2019_TeogenesMoura_tcc.pdfapplication/pdf2230926http://bdm.unb.br/xmlui/bitstream/10483/28923/1/2019_TeogenesMoura_tcc.pdf6dea895d329d3b69f8dc31a57ba82756MD5110483/289232021-10-15 14:20:50.347oai:bdm.unb.br:10483/28923w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712021-10-15T17:20:50Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
title Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
spellingShingle Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
Moura, Teógenes
Eleições
Ferramentas de busca na Web
Pesquisa na Internet
Processamento eletrônico de dados
title_short Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
title_full Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
title_fullStr Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
title_full_unstemmed Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
title_sort Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural
author Moura, Teógenes
author_facet Moura, Teógenes
author_role author
dc.contributor.author.fl_str_mv Moura, Teógenes
dc.contributor.advisor1.fl_str_mv Gonçalves, Vinicius Pereira
contributor_str_mv Gonçalves, Vinicius Pereira
dc.subject.keyword.pt_BR.fl_str_mv Eleições
Ferramentas de busca na Web
Pesquisa na Internet
Processamento eletrônico de dados
topic Eleições
Ferramentas de busca na Web
Pesquisa na Internet
Processamento eletrônico de dados
description Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-07-04
dc.date.accessioned.fl_str_mv 2021-10-15T17:20:50Z
dc.date.available.fl_str_mv 2021-10-15T17:20:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MOURA, Teógenes. Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural. 2019. 68 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019.
dc.identifier.uri.fl_str_mv https://bdm.unb.br/handle/10483/28923
identifier_str_mv MOURA, Teógenes. Monitorando e entendendo a eleição brasileira por meio de processamento de linguagem natural. 2019. 68 f., il. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação)—Universidade de Brasília, Brasília, 2019.
url https://bdm.unb.br/handle/10483/28923
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/28923/2/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/28923/1/2019_TeogenesMoura_tcc.pdf
bitstream.checksum.fl_str_mv 21554873e56ad8ddc69c092699b98f95
6dea895d329d3b69f8dc31a57ba82756
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1801493160848785408