Estudo sobre análise de sentimentos em textos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10174/18267 |
Resumo: | O sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline. |
id |
RCAP_489d78fa7c24d1716117455acb28cffc |
---|---|
oai_identifier_str |
oai:dspace.uevora.pt:10174/18267 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Estudo sobre análise de sentimentos em textosAnálise de sentimentosMineração de textosClassificação de polaridadeAprendizado supervisionadoCaracteristicas linguísticasOrientação semânticaAprendizado em máquinaSentiment analysisOpinion miningPolarity classificationSupervised learningLinguistic featuresSemantic orientationMachine learningO sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline.Universidade de Évora2016-04-12T15:48:24Z2016-04-122013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10174/18267http://hdl.handle.net/10174/18267TID:201135256porDepartamento de Informáticateses@bib.uevora.pt283Fernando, Henriquesinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-03T19:06:16Zoai:dspace.uevora.pt:10174/18267Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:10:11.709037Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Estudo sobre análise de sentimentos em textos |
title |
Estudo sobre análise de sentimentos em textos |
spellingShingle |
Estudo sobre análise de sentimentos em textos Fernando, Henriques Análise de sentimentos Mineração de textos Classificação de polaridade Aprendizado supervisionado Caracteristicas linguísticas Orientação semântica Aprendizado em máquina Sentiment analysis Opinion mining Polarity classification Supervised learning Linguistic features Semantic orientation Machine learning |
title_short |
Estudo sobre análise de sentimentos em textos |
title_full |
Estudo sobre análise de sentimentos em textos |
title_fullStr |
Estudo sobre análise de sentimentos em textos |
title_full_unstemmed |
Estudo sobre análise de sentimentos em textos |
title_sort |
Estudo sobre análise de sentimentos em textos |
author |
Fernando, Henriques |
author_facet |
Fernando, Henriques |
author_role |
author |
dc.contributor.author.fl_str_mv |
Fernando, Henriques |
dc.subject.por.fl_str_mv |
Análise de sentimentos Mineração de textos Classificação de polaridade Aprendizado supervisionado Caracteristicas linguísticas Orientação semântica Aprendizado em máquina Sentiment analysis Opinion mining Polarity classification Supervised learning Linguistic features Semantic orientation Machine learning |
topic |
Análise de sentimentos Mineração de textos Classificação de polaridade Aprendizado supervisionado Caracteristicas linguísticas Orientação semântica Aprendizado em máquina Sentiment analysis Opinion mining Polarity classification Supervised learning Linguistic features Semantic orientation Machine learning |
description |
O sentimento em opiniões terceiras sempre foi e continua a despertar interesse e extrema preocupação por parte dos gestores ou tomadores de decisões. Terceiros podem ser indivíduos, produtos, entidades empresariais, instituições de pesquisa e órgãos governamentais etc. dado que força de expressões e ideias controversas podem causar grandes celeumas. Desta forma o feedback emocional pode ser propulsor de mudanças, no sentido de proporcionar a busca contínua de melhorias por um lado ou determinar por outro o insucesso da entidade. Logo a análise de sentimentos é uma ferramenta indispensável no apoio ao processo de tomada de decisões. No processo de análise de sentimentos focamos na classificação de polaridade de opiniões em textos ou documentos em termos positiva ou negativa. Uma gama de Aplicações e recursos actualmente está alinhada à Língua Inglesa, o que mostra a existência de poucas experiências noutras Línguas. O objectivo é desenvolver um protótipo como ferramenta de auxílio a análise de opiniões em textos, auxiliado pelas técnicas de Aprendizado em Automática e Processamento em Linguagem Natural. Na realização de experiências aplicamos a Classificação Supervisionado a dois Corpus nomeadamente Review Movie e SentiCorpus-pt, que contém textos com opiniões sobre diversos filmes e políticos Portugueses participantes de um debate eleitoral respectivamente. A metodologia aplicada baseia-se na classificação de padrões linguísticos tais como PosTag, Chunking e outras formas simples de negação. Para a melhorar a classificação determinamos a orientação semântica das palavras, desde os seus recursos léxicos através do SentiWordnet Sense, que é uma ferramenta em Inglês que faz a tradução de qualquer língua para o Inglês, antes de extracção de polaridade. A nossa abordagem é avaliar os dois corpora. Tarefa que é auxiliada pelo casamento de termos linguísticos com vista a melhorar a performance. O classificador utiliza para tal o modelo Balsa de Palavras como linha de base; ABSTRACT: The feeling for third parties opinions has always been and it continues to arouse interest and extreme concern by managers or decision makers, third parties can be individuals, products, business organizations, research institutions and government institutions etc.. Knowing that expressions force and controversial ideas can cause major embarrassment. ln this way, the emotional feedback can be change propeller, in order to provide continuous search for improvements on one side or to determine on the other hands the failure of the entity. So, the sentiment analysis is an indispensable tool to support the process of decision making. ln the process of sentiment analysis we have focused on the classification of polarity of opinions in texts or documents in positive or negative terms. A range of applications and resources nowadays are aligned with English Language, which demonstrates the existence of few experiences in other languages. The aim is to develop a prototype as a supporting tool to analise texts opinions, supported by learning techniques on Machine and Natural Language Processing. When conducting experiments, we have applied the Supervised Classification into two Corpus namely Review Movie and SentiCorpus-pt, which contains texts with opinions of different films and Portuguesa politician’s participants in electoral debate respectively. The applied methodology is based on the classification of linguistic patterns such as Pos-tag, Chunking is other simple form of denial. To improve the classification and determine the semantic orientation of words, from the lexicon resources through SentiWordnet Sense, which is a tool in English that makes the translation from any language to English before identifying the polarity. Our approach is to evaluate the two corpus. Task that is supported by the marriage of linguistic terms in order to improve the performance. For such, the classifier uses the bags word model as the baseline. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-01-01T00:00:00Z 2016-04-12T15:48:24Z 2016-04-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10174/18267 http://hdl.handle.net/10174/18267 TID:201135256 |
url |
http://hdl.handle.net/10174/18267 |
identifier_str_mv |
TID:201135256 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Departamento de Informática teses@bib.uevora.pt 283 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade de Évora |
publisher.none.fl_str_mv |
Universidade de Évora |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799136584392507392 |