Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/20993 |
Resumo: | Mestrado em Gestão de Sistemas de Informação |
id |
RCAP_43a805abbb203d706440abd799694e10 |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/20993 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a systemBig DataMachine LearningProcessamento Natural de LinguagemAnálise de SentimentosReputação OnlineOnline ReputationNatural Language ProcessingSentiment AnalysisMestrado em Gestão de Sistemas de InformaçãoNunca se geraram tantos dados e a um ritmo tão alucinante como atualmente. Vive-se indubitavelmente numa era de Big Data e este termo não passa despercebido, trazendo consigo inúmeros desafios, mas também múltiplas oportunidades. Cerca de 80% dos dados encontra-se de forma desestruturada. Aqui, há um foco especial para o formato de texto, formato esse que para além de comum, agrega um grande potencial. Existem várias aplicações, técnicas e ferramentas associadas à análise de documentos textuais, e esta área surge fortemente ligada ao Processamento de Linguagem Natural. Um dos grandes desafios de ambos está relacionado com Análise de Sentimentos. Sendo interessante aliar tendências e abordar questões como a reputação online, o presente projeto focou-se na criação de um sistema capaz de identificar o sentimento associado a figuras públicas demonstrado através de publicações no Twitter. Com essa finalidade, o levou-se a cabo uma revisão de literatura capaz de explicitar os tópicos associados à temática escolhida. Relativamente ao sistema, optou-se por uma abordagem de Machine Learning com recurso a métodos supervisionados de aprendizagem. Para tal, criou-se um dataset manualmente anotado e procedeu-se ao treino de três classificadores (Naïve Bayes, Support Vector Machines e Entropia Máxima). O impacto de algumas técnicas de pré-processamento também foi medido. Os resultados obtidos não foram tão bons como desejado, mas o melhor modelo foi incorporado no sistema. Este projeto contribuiu para aumentar a base de conhecimento das áreas em que se insere, e fornece ainda um dataset manualmente anotado que poderá ser utilizado em investigações futuras.Never has so much data been generated and at such an astounding rate as nowadays. This is undoubtedly an era of Big Data and this term does not go unnoticed, bearing within innumerous challenges, but also a multitude of opportunities. Of the generated data, roughly 80% comes unstructured, and there is a special focus on the text format, which appears frequently and carries great potential. There are several applications, techniques and tools connected to the analysis of textual documents and this area is strongly linked to Natural Language Processing. One of the greatest challenges of both is related to Sentiment Analysis. Since it would be interesting to combine trends and address issues such as online reputation, this project focused on creating a system capable of identifying the sentiment associated with public figures, demonstrated through Twitter publications. Firstly, a literature review capable of exploring the topics associated with the chosen subject was carried out. Afterwards,and regarding the system, a Machine Learning approach using supervised learning methods was adopted. For this, a manually annotated dataset was created and three of the most used classifiers (Naïve Bayes, Support Vector Machines and Maximum Entropy) were trained. The impact of some pre-processing techniques was also assessed. The obtained results were not as good as initially desired, nonetheless the best model was chosen to incorporate the system. This project contributed to increase the knowledge base of the areas in which it is comprised and provides a manually annotated dataset that can be used in further research.Instituto Superior de Economia e GestãoFernandes, JesualdoRepositório da Universidade de LisboaViegas, Catarina Correia2021-08-06T00:30:13Z2020-112020-11-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/20993engViegas, Catarina Correia (2020). "Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:50:24Zoai:www.repository.utl.pt:10400.5/20993Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:05:39.501630Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
title |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
spellingShingle |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system Viegas, Catarina Correia Big Data Machine Learning Processamento Natural de Linguagem Análise de Sentimentos Reputação Online Online Reputation Natural Language Processing Sentiment Analysis |
title_short |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
title_full |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
title_fullStr |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
title_full_unstemmed |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
title_sort |
Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system |
author |
Viegas, Catarina Correia |
author_facet |
Viegas, Catarina Correia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fernandes, Jesualdo Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Viegas, Catarina Correia |
dc.subject.por.fl_str_mv |
Big Data Machine Learning Processamento Natural de Linguagem Análise de Sentimentos Reputação Online Online Reputation Natural Language Processing Sentiment Analysis |
topic |
Big Data Machine Learning Processamento Natural de Linguagem Análise de Sentimentos Reputação Online Online Reputation Natural Language Processing Sentiment Analysis |
description |
Mestrado em Gestão de Sistemas de Informação |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-11 2020-11-01T00:00:00Z 2021-08-06T00:30:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/20993 |
url |
http://hdl.handle.net/10400.5/20993 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Viegas, Catarina Correia (2020). "Assessing public figures’ reputation through sentiment analysis on twitter using machine learning : creation of a system". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131148448694272 |