Estudo sobre análise de sentimentos em textos

Detalhes bibliográficos
Autor(a) principal: Fernando, Henriques
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10174/18267
Resumo: O sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline.
id RCAP_489d78fa7c24d1716117455acb28cffc
oai_identifier_str oai:dspace.uevora.pt:10174/18267
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estudo sobre análise de sentimentos em textosAnálise de sentimentosMineração de textosClassificação de polaridadeAprendizado supervisionadoCaracteristicas linguísticasOrientação semânticaAprendizado em máquinaSentiment analysisOpinion miningPolarity classificationSupervised learningLinguistic featuresSemantic orientationMachine learningO sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline.Universidade de Évora2016-04-12T15:48:24Z2016-04-122013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10174/18267http://hdl.handle.net/10174/18267TID:201135256porDepartamento de Informáticateses@bib.uevora.pt283Fernando, Henriquesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-03T19:06:16Zoai:dspace.uevora.pt:10174/18267Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:10:11.709037Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estudo sobre análise de sentimentos em textos
title Estudo sobre análise de sentimentos em textos
spellingShingle Estudo sobre análise de sentimentos em textos
Fernando, Henriques
Análise de sentimentos
Mineração de textos
Classificação de polaridade
Aprendizado supervisionado
Caracteristicas linguísticas
Orientação semântica
Aprendizado em máquina
Sentiment analysis
Opinion mining
Polarity classification
Supervised learning
Linguistic features
Semantic orientation
Machine learning
title_short Estudo sobre análise de sentimentos em textos
title_full Estudo sobre análise de sentimentos em textos
title_fullStr Estudo sobre análise de sentimentos em textos
title_full_unstemmed Estudo sobre análise de sentimentos em textos
title_sort Estudo sobre análise de sentimentos em textos
author Fernando, Henriques
author_facet Fernando, Henriques
author_role author
dc.contributor.author.fl_str_mv Fernando, Henriques
dc.subject.por.fl_str_mv Análise de sentimentos
Mineração de textos
Classificação de polaridade
Aprendizado supervisionado
Caracteristicas linguísticas
Orientação semântica
Aprendizado em máquina
Sentiment analysis
Opinion mining
Polarity classification
Supervised learning
Linguistic features
Semantic orientation
Machine learning
topic Análise de sentimentos
Mineração de textos
Classificação de polaridade
Aprendizado supervisionado
Caracteristicas linguísticas
Orientação semântica
Aprendizado em máquina
Sentiment analysis
Opinion mining
Polarity classification
Supervised learning
Linguistic features
Semantic orientation
Machine learning
description O sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline.
publishDate 2013
dc.date.none.fl_str_mv 2013-01-01T00:00:00Z
2016-04-12T15:48:24Z
2016-04-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10174/18267
http://hdl.handle.net/10174/18267
TID:201135256
url http://hdl.handle.net/10174/18267
identifier_str_mv TID:201135256
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Departamento de Informática
teses@bib.uevora.pt
283
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de Évora
publisher.none.fl_str_mv Universidade de Évora
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136584392507392