Análise de sentimento em texto no domínio económico
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.6/10020 |
Resumo: | A expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico. |
id |
RCAP_a85fff539794b2a9edf6466f54307735 |
---|---|
oai_identifier_str |
oai:ubibliorum.ubi.pt:10400.6/10020 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Análise de sentimento em texto no domínio económicoAnálise de Sentimento Em TextoDomínio EconómicoLéxicoTaxa de AcertoDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico.The expansion of the Internet and the emergence of social networks are provoking the constant growth of online text. In order to help organizations in the control of their customers’ opinions, issued in this new communication channel, arised the Text Sentiment Analysis (TSA). This science is concerned with the development of computer systems to classify sentiment in large amounts of unstructured text. Being a recent area, this subdomain of Natural Language Processing suffers from lack of resources for the text of the economic domain in Portuguese. Given this reality, with the aim of equipping Portuguese, the similarity of English, knowledge, tools and resources for AST in the economic domain, in this work, it was verified that the generic AST lexicons in Portuguese present good results when they are used specific domain. They worked particularly with the economic domain. For this, we developed the SentiSoft, AST system. Using lexical databases such as Sentilex-Pt and OpLexicon, the hit rate ranged from 81 % to 74 %, hence in economic domain text, below 35 %. The variation of the semantic sense of the words in relation to the context was pointed out as the main cause of this failure. Thus, it was concluded that the generic lexicons in Portuguese do not present good results when they are used in specific domains and it was suggested the elaboration of a lexicon exclusively for the economic domain.Cordeiro, João Paulo da CostauBibliorumZankulu, Mvita2020-03-12T16:57:56Z2018-11-222018-10-082018-11-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.6/10020TID:202355900porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-15T09:51:24Zoai:ubibliorum.ubi.pt:10400.6/10020Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T00:50:05.095091Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Análise de sentimento em texto no domínio económico |
title |
Análise de sentimento em texto no domínio económico |
spellingShingle |
Análise de sentimento em texto no domínio económico Zankulu, Mvita Análise de Sentimento Em Texto Domínio Económico Léxico Taxa de Acerto Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Análise de sentimento em texto no domínio económico |
title_full |
Análise de sentimento em texto no domínio económico |
title_fullStr |
Análise de sentimento em texto no domínio económico |
title_full_unstemmed |
Análise de sentimento em texto no domínio económico |
title_sort |
Análise de sentimento em texto no domínio económico |
author |
Zankulu, Mvita |
author_facet |
Zankulu, Mvita |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cordeiro, João Paulo da Costa uBibliorum |
dc.contributor.author.fl_str_mv |
Zankulu, Mvita |
dc.subject.por.fl_str_mv |
Análise de Sentimento Em Texto Domínio Económico Léxico Taxa de Acerto Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Análise de Sentimento Em Texto Domínio Económico Léxico Taxa de Acerto Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
A expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-11-22 2018-10-08 2018-11-22T00:00:00Z 2020-03-12T16:57:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.6/10020 TID:202355900 |
url |
http://hdl.handle.net/10400.6/10020 |
identifier_str_mv |
TID:202355900 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799136391392657408 |