Análise de sentimento em microblogues com base em cascatas de classificacao
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10071/13040 |
Resumo: | Esta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas. |
id |
RCAP_4ff15ccbf66d25384687132dd3766ece |
---|---|
oai_identifier_str |
oai:repositorio.iscte-iul.pt:10071/13040 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Análise de sentimento em microblogues com base em cascatas de classificacaoArquitetura de computadoresAlgoritmo de aprendizagemRegressão logísticaRede socialBlogsCascatas de classificaçãoAprendizagem automáticaAnalise de sentimentoWEKAClassification cascadesMachine learningSentiment analysisEsta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas.This thesis describes a classification platform that enables to use and apply binary classifiers in cascade. The platform uses existing machine learning algorithms from WEKA software that provides an API for this purpose, having been tested in sentiment classification of tweets and blogs. This platform allowed also to analyze and compare different classification cascades with the classifiers Naive Bayes, Logistic Regression and Support Vector Machines which implements the Sequential Minimal Optimization algorithm to optimize the training phase. In this case study were explored various classification architectures with a maximum of three levels, combining different binary classifiers for classification in four and six classes. As input for the classifiers, were extracted characteristics of each of the documents and utilized polarity lexicons associated to the words. In general, architectures based on Sequential Minimal Optimization get the best results. The different classifiers get their best results with different architectures.2017-04-19T16:59:03Z2016-01-01T00:00:00Z20162016-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/octet-streamhttp://hdl.handle.net/10071/13040TID:201542340porRebelo, Fernando Manuel Diasinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T17:31:09Zoai:repositorio.iscte-iul.pt:10071/13040Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:14:00.101211Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Análise de sentimento em microblogues com base em cascatas de classificacao |
title |
Análise de sentimento em microblogues com base em cascatas de classificacao |
spellingShingle |
Análise de sentimento em microblogues com base em cascatas de classificacao Rebelo, Fernando Manuel Dias Arquitetura de computadores Algoritmo de aprendizagem Regressão logística Rede social Blogs Cascatas de classificação Aprendizagem automática Analise de sentimento WEKA Classification cascades Machine learning Sentiment analysis |
title_short |
Análise de sentimento em microblogues com base em cascatas de classificacao |
title_full |
Análise de sentimento em microblogues com base em cascatas de classificacao |
title_fullStr |
Análise de sentimento em microblogues com base em cascatas de classificacao |
title_full_unstemmed |
Análise de sentimento em microblogues com base em cascatas de classificacao |
title_sort |
Análise de sentimento em microblogues com base em cascatas de classificacao |
author |
Rebelo, Fernando Manuel Dias |
author_facet |
Rebelo, Fernando Manuel Dias |
author_role |
author |
dc.contributor.author.fl_str_mv |
Rebelo, Fernando Manuel Dias |
dc.subject.por.fl_str_mv |
Arquitetura de computadores Algoritmo de aprendizagem Regressão logística Rede social Blogs Cascatas de classificação Aprendizagem automática Analise de sentimento WEKA Classification cascades Machine learning Sentiment analysis |
topic |
Arquitetura de computadores Algoritmo de aprendizagem Regressão logística Rede social Blogs Cascatas de classificação Aprendizagem automática Analise de sentimento WEKA Classification cascades Machine learning Sentiment analysis |
description |
Esta dissertação descreve uma plataforma de classificação que permite utilizar e aplicar classificadores binários em cascata. A plataforma utiliza algoritmos de aprendizagem automática existentes no software WEKA que disponibiliza uma API para esse efeito, tendo sido testada na classificação de sentimento de tweets e blogues. Esta plataforma permitiu também analisar e comparar diferentes cascatas de classificação com os classificadores Naive Bayes, Regressão Logística e Support Vector Machines que implementa o algoritmo Sequential Minimal Optimization para otimização da fase de treino. Neste caso de estudo foram exploradas várias arquiteturas de classificação com um máximo de três níveis, combinando diversos classificadores binários, para classificação em quatro e seis classes. Como entrada para os classificadores, foram extraídas características de cada um dos documentos e utilizados léxicos de polaridade associados às palavras. Em geral, as arquiteturas que utilizam Support Vector Machines obtêm os melhores resultados. Os diferentes classificadores obtêm os seus melhores resultados com diferentes arquiteturas. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-01-01T00:00:00Z 2016 2016-09 2017-04-19T16:59:03Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10071/13040 TID:201542340 |
url |
http://hdl.handle.net/10071/13040 |
identifier_str_mv |
TID:201542340 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/octet-stream |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134696677834752 |