Análise de sentimento em microblogues com base em cascatas de classificacao

Detalhes bibliográficos
Autor(a) principal: Rebelo, Fernando Manuel Dias
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10071/13040
Resumo: Esta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas.
id RCAP_4ff15ccbf66d25384687132dd3766ece
oai_identifier_str oai:repositorio.iscte-iul.pt:10071/13040
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise de sentimento em microblogues com base em cascatas de classificacaoArquitetura de computadoresAlgoritmo de aprendizagemRegressão logísticaRede socialBlogsCascatas de classificaçãoAprendizagem automáticaAnalise de sentimentoWEKAClassification cascadesMachine learningSentiment analysisEsta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas.This thesis describes a classification platform that enables to use and apply binary classifiers in cascade. The platform uses existing machine learning algorithms from WEKA software that provides an API for this purpose, having been tested in sentiment classification of tweets and blogs. This platform allowed also to analyze and compare different classification cascades with the classifiers Naive Bayes, Logistic Regression and Support Vector Machines which implements the Sequential Minimal Optimization algorithm to optimize the training phase. In this case study were explored various classification architectures with a maximum of three levels, combining different binary classifiers for classification in four and six classes. As input for the classifiers, were extracted characteristics of each of the documents and utilized polarity lexicons associated to the words. In general, architectures based on Sequential Minimal Optimization get the best results. The different classifiers get their best results with different architectures.2017-04-19T16:59:03Z2016-01-01T00:00:00Z20162016-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/octet-streamhttp://hdl.handle.net/10071/13040TID:201542340porRebelo, Fernando Manuel Diasinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T17:31:09Zoai:repositorio.iscte-iul.pt:10071/13040Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:14:00.101211Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise de sentimento em microblogues com base em cascatas de classificacao
title Análise de sentimento em microblogues com base em cascatas de classificacao
spellingShingle Análise de sentimento em microblogues com base em cascatas de classificacao
Rebelo, Fernando Manuel Dias
Arquitetura de computadores
Algoritmo de aprendizagem
Regressão logística
Rede social
Blogs
Cascatas de classificação
Aprendizagem automática
Analise de sentimento
WEKA
Classification cascades
Machine learning
Sentiment analysis
title_short Análise de sentimento em microblogues com base em cascatas de classificacao
title_full Análise de sentimento em microblogues com base em cascatas de classificacao
title_fullStr Análise de sentimento em microblogues com base em cascatas de classificacao
title_full_unstemmed Análise de sentimento em microblogues com base em cascatas de classificacao
title_sort Análise de sentimento em microblogues com base em cascatas de classificacao
author Rebelo, Fernando Manuel Dias
author_facet Rebelo, Fernando Manuel Dias
author_role author
dc.contributor.author.fl_str_mv Rebelo, Fernando Manuel Dias
dc.subject.por.fl_str_mv Arquitetura de computadores
Algoritmo de aprendizagem
Regressão logística
Rede social
Blogs
Cascatas de classificação
Aprendizagem automática
Analise de sentimento
WEKA
Classification cascades
Machine learning
Sentiment analysis
topic Arquitetura de computadores
Algoritmo de aprendizagem
Regressão logística
Rede social
Blogs
Cascatas de classificação
Aprendizagem automática
Analise de sentimento
WEKA
Classification cascades
Machine learning
Sentiment analysis
description Esta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas.
publishDate 2016
dc.date.none.fl_str_mv 2016-01-01T00:00:00Z
2016
2016-09
2017-04-19T16:59:03Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10071/13040
TID:201542340
url http://hdl.handle.net/10071/13040
identifier_str_mv TID:201542340
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/octet-stream
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134696677834752