Aplicação de técnicas de data mining para previsibilidade eleitoral

Detalhes bibliográficos
Autor(a) principal: Guedes, Pedro Casali
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/200018
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
id UFSC_cef7c4527b0ee30061e47054f92e7ec4
oai_identifier_str oai:repositorio.ufsc.br:123456789/200018
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaGuedes, Pedro CasaliSilveira, Hector Bessa2019-08-21T19:42:52Z2019-08-21T19:42:52Z2018https://repositorio.ufsc.br/handle/123456789/200018TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.Após casos de imprevisibilidades eleitorais nos Estados Unidos e no Reino Unido em 2016, havia uma preocupação para que o mesmo ocorresse nas eleições presidenciais brasileiras de 2018 desde o início do período eleitoral. A Ciência Política, por sua vez, apresenta diversas teorias que buscam avaliar essa questão. Entretanto, há limitações quanto aos dados utilizados nas pesquisas dessa área, além de não considerarem os efeitos das redes sociais em suas análises. Por fim, com a Reforma Político-Eleitoral de 2017, a duração das campanhas eleitorais foi reduzida, bem como foram impostas limitações financeiras a elas, demandando novas estratégias dos candidatos. Desse modo, este projeto propõe um novo método de prever resultados de eleições, baseando-se na teoria de estratégias emocionais da Neuropolítica. Aplicando a Design Science Research Methodology (DSRM), uma das metodologias mais utilizadas em projetos de pesquisa, o objetivo deste trabalho é categorizar as diferentes publicações (de 1° de janeiro até 6 de outubro de 2018) na rede social Twitter de oito dos principais candidatos à Presidência da República conforme os sentimentos transmitidos. Para isso, foram aplicadas e avaliadas diversas técnicas de mineração de opiniões (uma aplicação de data mining), como: aquisição de dados por meio de um web scraper, pré-processamento dos textos utilizando de diferentes ferramentas, categorização (com base no uso de léxicos e de seis algoritmos de aprendizado de máquina) e até a apresentação visual dos resultados. Para a construção do modelo de categorização, optou-se pelo uso do algoritmo de aprendizado de máquina de Naïve-Bayes, sendo este um dos trabalhos pioneiros no Brasil em uso de técnicas de machine learning na previsibilidade eleitoral. A partir de sua aplicação, os tweets publicados foram classificados em três emoções: positivas, negativas e neutras. Os resultados obtidos neste trabalho foram preliminares e não conclusivos em relação à previsão das eleições. Entretanto, foi permitido diferenciar as estratégias emocionais de cada candidato, as quais apresentaram relação com eventos externos que ocorreram ao longo do período eleitoral, comprovando que a teoria da Neuropolítica aplicada possui influência nas campanhas e que o modelo de classificação criado é válido para avaliá-la. Com isso, o trabalho apresenta perspectivas de maiores contribuições futuras à área de previsibilidade eleitoral com base no uso de técnicas de aprendizagem de máquina.After cases of electoral unpredictability in the United Stated and in the United Kingdom, in 2016, there were concerns that the same could happen in the 2018 Brazilian presidential elections since the beginning of the campaign period. Within Political Science, there are a few different theories which focus on studying such issues. However, there are some limitations with respect to the data used in those researches, as well as not including the effects of social media in their analysis. Finally, with the Political-Electoral Reform of 2017, campaigns’ durations were reduced as well as their allowed budget, which demands new strategies by the candidates. With such scenario, this project proposes a new method to predict election results, based on Neuropolitics’ emotional strategies theory. By applying the Design Science Research Methodology (DSRM), one of the most used methodologies in research projects, the goal is to categorize tweets shared by eight of the main candidates to Brazil’s Presidency during the period of January 1st until October 6th of 2018, according to their emotions. In order to achieve this, many techniques of text mining (one of many areas of data mining) were applied and evaluated, such as: data acquisition through a web scraper, text pre- processing with the use of different tools, classification (based on the use of dictionaries as well as six different machine learning algorithms) and even visually presenting the results. For building the classification model, it was applied machine learning’s Naïve-Bayes Algorithm, which makes this work one of the firsts in Brazil to use machine learning techniques in electoral predictability. With it, the available tweets were classified into three different emotions: positive, negative and neutral. The results obtained with this work were preliminary and non-conclusive about its capability of predicting elections. However, one was able to differentiate each candidate’s emotional strategies, which showed relation to events (such as breaking news) that occurred during the electoral period, thus showing that the Neuropolitcs’ theory applied does have influence in campaigns and that the classification model built is valid to evaluate this theory. Therefore, this work presents future perspectives for significant contributions in electoral predictability based on the use of machine learning techniques.Florianópolis, SC.mineração de textos. Análise de sentimentos. Previsibilidade eleitoral.text mining. Sentiment analysis. Electoral predictability.Aplicação de técnicas de data mining para previsibilidade eleitoralinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCLICENSElicense.txtlicense.txttext/plain; charset=utf-81383https://repositorio.ufsc.br/bitstream/123456789/200018/2/license.txt11ee89cd31d893362820eab7c4d46734MD52ORIGINALPFC Pedro Casali Guedes_2018-2.pdfPFC Pedro Casali Guedes_2018-2.pdfapplication/pdf8806826https://repositorio.ufsc.br/bitstream/123456789/200018/1/PFC%20Pedro%20Casali%20Guedes_2018-2.pdf4945b44ef44a2780b0b6d8c1e9575670MD51123456789/2000182019-08-21 16:42:52.616oai:repositorio.ufsc.br:123456789/200018Vm9jw6ogdGVtIGEgbGliZXJkYWRlIGRlOiBDb21wYXJ0aWxoYXIg4oCUIGNvcGlhciwgZGlzdHJpYnVpciBlIHRyYW5zbWl0aXIgYSBvYnJhLiBSZW1peGFyIOKAlCBjcmlhciBvYnJhcyBkZXJpdmFkYXMuClNvYiBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6IEF0cmlidWnDp8OjbyDigJQgVm9jw6ogZGV2ZSBjcmVkaXRhciBhIG9icmEgZGEgZm9ybWEgZXNwZWNpZmljYWRhIHBlbG8gYXV0b3Igb3UgbGljZW5jaWFudGUgKG1hcyBuw6NvIGRlIG1hbmVpcmEgcXVlIHN1Z2lyYSBxdWUgZXN0ZXMgY29uY2VkZW0gcXVhbHF1ZXIgYXZhbCBhIHZvY8OqIG91IGFvIHNldSB1c28gZGEgb2JyYSkuIFVzbyBuw6NvLWNvbWVyY2lhbCDigJQgVm9jw6ogbsOjbyBwb2RlIHVzYXIgZXN0YSBvYnJhIHBhcmEgZmlucyBjb21lcmNpYWlzLgpGaWNhbmRvIGNsYXJvIHF1ZTogUmVuw7puY2lhIOKAlCBRdWFscXVlciBkYXMgY29uZGnDp8O1ZXMgYWNpbWEgcG9kZSBzZXIgcmVudW5jaWFkYSBzZSB2b2PDqiBvYnRpdmVyIHBlcm1pc3PDo28gZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMuIERvbcOtbmlvIFDDumJsaWNvIOKAlCBPbmRlIGEgb2JyYSBvdSBxdWFscXVlciBkZSBzZXVzIGVsZW1lbnRvcyBlc3RpdmVyIGVtIGRvbcOtbmlvIHDDumJsaWNvIHNvYiBvIGRpcmVpdG8gYXBsaWPDoXZlbCwgZXN0YSBjb25kacOnw6NvIG7Do28gw6ksIGRlIG1hbmVpcmEgYWxndW1hLCBhZmV0YWRhIHBlbGEgbGljZW7Dp2EuIE91dHJvcyBEaXJlaXRvcyDigJQgT3Mgc2VndWludGVzIGRpcmVpdG9zIG7Do28gc8OjbywgZGUgbWFuZWlyYSBhbGd1bWEsIGFmZXRhZG9zIHBlbGEgbGljZW7Dp2E6IExpbWl0YcOnw7VlcyBlIGV4Y2XDp8O1ZXMgYW9zIGRpcmVpdG9zIGF1dG9yYWlzIG91IHF1YWlzcXVlciB1c29zIGxpdnJlcyBhcGxpY8OhdmVpczsgT3MgZGlyZWl0b3MgbW9yYWlzIGRvIGF1dG9yOyBEaXJlaXRvcyBxdWUgb3V0cmFzIHBlc3NvYXMgcG9kZW0gdGVyIHNvYnJlIGEgb2JyYSBvdSBzb2JyZSBhIHV0aWxpemHDp8OjbyBkYSBvYnJhLCB0YWlzIGNvbW8gZGlyZWl0b3MgZGUgaW1hZ2VtIG91IHByaXZhY2lkYWRlLiBBdmlzbyDigJQgUGFyYSBxdWFscXVlciByZXV0aWxpemHDp8OjbyBvdSBkaXN0cmlidWnDp8Ojbywgdm9jw6ogZGV2ZSBkZWl4YXIgY2xhcm8gYSB0ZXJjZWlyb3Mgb3MgdGVybW9zIGRhIGxpY2Vuw6dhIGEgcXVlIHNlIGVuY29udHJhIHN1Ym1ldGlkYSBlc3RhIG9icmEuIEEgbWVsaG9yIG1hbmVpcmEgZGUgZmF6ZXIgaXNzbyDDqSBjb20gdW0gbGluayBwYXJhIGVzdGEgcMOhZ2luYS4KTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyAtIGh0dHA6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLzMuMC9ici8KRepositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732019-08-21T19:42:52Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.pt_BR.fl_str_mv Aplicação de técnicas de data mining para previsibilidade eleitoral
title Aplicação de técnicas de data mining para previsibilidade eleitoral
spellingShingle Aplicação de técnicas de data mining para previsibilidade eleitoral
Guedes, Pedro Casali
mineração de textos. Análise de sentimentos. Previsibilidade eleitoral.
text mining. Sentiment analysis. Electoral predictability.
title_short Aplicação de técnicas de data mining para previsibilidade eleitoral
title_full Aplicação de técnicas de data mining para previsibilidade eleitoral
title_fullStr Aplicação de técnicas de data mining para previsibilidade eleitoral
title_full_unstemmed Aplicação de técnicas de data mining para previsibilidade eleitoral
title_sort Aplicação de técnicas de data mining para previsibilidade eleitoral
author Guedes, Pedro Casali
author_facet Guedes, Pedro Casali
author_role author
dc.contributor.pt_BR.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Guedes, Pedro Casali
dc.contributor.advisor1.fl_str_mv Silveira, Hector Bessa
contributor_str_mv Silveira, Hector Bessa
dc.subject.por.fl_str_mv mineração de textos. Análise de sentimentos. Previsibilidade eleitoral.
text mining. Sentiment analysis. Electoral predictability.
topic mineração de textos. Análise de sentimentos. Previsibilidade eleitoral.
text mining. Sentiment analysis. Electoral predictability.
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-08-21T19:42:52Z
dc.date.available.fl_str_mv 2019-08-21T19:42:52Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/200018
url https://repositorio.ufsc.br/handle/123456789/200018
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/200018/2/license.txt
https://repositorio.ufsc.br/bitstream/123456789/200018/1/PFC%20Pedro%20Casali%20Guedes_2018-2.pdf
bitstream.checksum.fl_str_mv 11ee89cd31d893362820eab7c4d46734
4945b44ef44a2780b0b6d8c1e9575670
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805262571667456