Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system

Detalhes bibliográficos
Autor(a) principal: Viegas, Catarina Correia
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.5/20993
Resumo: Mestrado em Gestão de Sistemas de Informação
id RCAP_43a805abbb203d706440abd799694e10
oai_identifier_str oai:www.repository.utl.pt:10400.5/20993
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a systemBig DataMachine LearningProcessamento Natural de LinguagemAnálise de SentimentosReputação OnlineOnline ReputationNatural Language ProcessingSentiment AnalysisMestrado em Gestão de Sistemas de InformaçãoNunca se geraram tantos dados e a um ritmo tão alucinante como atualmente. Vive-se indubitavelmente numa era de Big Data e este termo não passa despercebido, trazendo consigo inúmeros desafios, mas também múltiplas oportunidades. Cerca de 80% dos dados encontra-se de forma desestruturada. Aqui, há um foco especial para o formato de texto, formato esse que para além de comum, agrega um grande potencial. Existem várias aplicações, técnicas e ferramentas associadas à análise de documentos textuais, e esta área surge fortemente ligada ao Processamento de Linguagem Natural. Um dos grandes desafios de ambos está relacionado com Análise de Sentimentos. Sendo interessante aliar tendências e abordar questões como a reputação online, o presente projeto focou-se na criação de um sistema capaz de identificar o sentimento associado a figuras públicas demonstrado através de publicações no Twitter. Com essa finalidade, o levou-se a cabo uma revisão de literatura capaz de explicitar os tópicos associados à temática escolhida. Relativamente ao sistema, optou-se por uma abordagem de Machine Learning com recurso a métodos supervisionados de aprendizagem. Para tal, criou-se um dataset manualmente anotado e procedeu-se ao treino de três classificadores (Naïve Bayes, Support Vector Machines e Entropia Máxima). O impacto de algumas técnicas de pré-processamento também foi medido. Os resultados obtidos não foram tão bons como desejado, mas o melhor modelo foi incorporado no sistema. Este projeto contribuiu para aumentar a base de conhecimento das áreas em que se insere, e fornece ainda um dataset manualmente anotado que poderá ser utilizado em investigações futuras.Never has so much data been generated and at such an astounding rate as nowadays. This is undoubtedly an era of Big Data and this term does not go unnoticed, bearing within innumerous challenges, but also a multitude of opportunities. Of the generated data, roughly 80% comes unstructured, and there is a special focus on the text format, which appears frequently and carries great potential. There are several applications, techniques and tools connected to the analysis of textual documents and this area is strongly linked to Natural Language Processing. One of the greatest challenges of both is related to Sentiment Analysis. Since it would be interesting to combine trends and address issues such as online reputation, this project focused on creating a system capable of identifying the sentiment associated with public figures, demonstrated through Twitter publications. Firstly, a literature review capable of exploring the topics associated with the chosen subject was carried out. Afterwards,and regarding the system, a Machine Learning approach using supervised learning methods was adopted. For this, a manually annotated dataset was created and three of the most used classifiers (Naïve Bayes, Support Vector Machines and Maximum Entropy) were trained. The impact of some pre-processing techniques was also assessed. The obtained results were not as good as initially desired, nonetheless the best model was chosen to incorporate the system. This project contributed to increase the knowledge base of the areas in which it is comprised and provides a manually annotated dataset that can be used in further research.Instituto Superior de Economia e GestãoFernandes, JesualdoRepositório da Universidade de LisboaViegas, Catarina Correia2021-08-06T00:30:13Z2020-112020-11-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/20993engViegas, Catarina Correia (2020). "Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:50:24Zoai:www.repository.utl.pt:10400.5/20993Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:05:39.501630Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
title Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
spellingShingle Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
Viegas, Catarina Correia
Big Data
Machine Learning
Processamento Natural de Linguagem
Análise de Sentimentos
Reputação Online
Online Reputation
Natural Language Processing
Sentiment Analysis
title_short Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
title_full Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
title_fullStr Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
title_full_unstemmed Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
title_sort Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
author Viegas, Catarina Correia
author_facet Viegas, Catarina Correia
author_role author
dc.contributor.none.fl_str_mv Fernandes, Jesualdo
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Viegas, Catarina Correia
dc.subject.por.fl_str_mv Big Data
Machine Learning
Processamento Natural de Linguagem
Análise de Sentimentos
Reputação Online
Online Reputation
Natural Language Processing
Sentiment Analysis
topic Big Data
Machine Learning
Processamento Natural de Linguagem
Análise de Sentimentos
Reputação Online
Online Reputation
Natural Language Processing
Sentiment Analysis
description Mestrado em Gestão de Sistemas de Informação
publishDate 2020
dc.date.none.fl_str_mv 2020-11
2020-11-01T00:00:00Z
2021-08-06T00:30:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/20993
url http://hdl.handle.net/10400.5/20993
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Viegas, Catarina Correia (2020). "Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
publisher.none.fl_str_mv Instituto Superior de Economia e Gestão
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131148448694272