Análise de sentimento em texto no domínio económico

Detalhes bibliográficos
Autor(a) principal: Zankulu, Mvita
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.6/10020
Resumo: A expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico.
id RCAP_a85fff539794b2a9edf6466f54307735
oai_identifier_str oai:ubibliorum.ubi.pt:10400.6/10020
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise de sentimento em texto no domínio económicoAnálise de Sentimento Em TextoDomínio EconómicoLéxicoTaxa de AcertoDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico.The expansion of the Internet and the emergence of social networks are provoking the constant growth of online text. In order to help organizations in the control of their customers’ opinions, issued in this new communication channel, arised the Text Sentiment Analysis (TSA). This science is concerned with the development of computer systems to classify sentiment in large amounts of unstructured text. Being a recent area, this subdomain of Natural Language Processing suffers from lack of resources for the text of the economic domain in Portuguese. Given this reality, with the aim of equipping Portuguese, the similarity of English, knowledge, tools and resources for AST in the economic domain, in this work, it was verified that the generic AST lexicons in Portuguese present good results when they are used specific domain. They worked particularly with the economic domain. For this, we developed the SentiSoft, AST system. Using lexical databases such as Sentilex-Pt and OpLexicon, the hit rate ranged from 81 % to 74 %, hence in economic domain text, below 35 %. The variation of the semantic sense of the words in relation to the context was pointed out as the main cause of this failure. Thus, it was concluded that the generic lexicons in Portuguese do not present good results when they are used in specific domains and it was suggested the elaboration of a lexicon exclusively for the economic domain.Cordeiro, João Paulo da CostauBibliorumZankulu, Mvita2020-03-12T16:57:56Z2018-11-222018-10-082018-11-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.6/10020TID:202355900porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-15T09:51:24Zoai:ubibliorum.ubi.pt:10400.6/10020Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T00:50:05.095091Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise de sentimento em texto no domínio económico
title Análise de sentimento em texto no domínio económico
spellingShingle Análise de sentimento em texto no domínio económico
Zankulu, Mvita
Análise de Sentimento Em Texto
Domínio Económico
Léxico
Taxa de Acerto
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Análise de sentimento em texto no domínio económico
title_full Análise de sentimento em texto no domínio económico
title_fullStr Análise de sentimento em texto no domínio económico
title_full_unstemmed Análise de sentimento em texto no domínio económico
title_sort Análise de sentimento em texto no domínio económico
author Zankulu, Mvita
author_facet Zankulu, Mvita
author_role author
dc.contributor.none.fl_str_mv Cordeiro, João Paulo da Costa
uBibliorum
dc.contributor.author.fl_str_mv Zankulu, Mvita
dc.subject.por.fl_str_mv Análise de Sentimento Em Texto
Domínio Económico
Léxico
Taxa de Acerto
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Análise de Sentimento Em Texto
Domínio Económico
Léxico
Taxa de Acerto
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description A expansão da Internet e o surgimento das redes sociais suscitam o constante crescimento de texto on-line. Para ajudar as organizações no controlo do ponto de vista dos seus clientes emitido nesse novo canal de comunicação, surgiu a Análise de Sentimento em Texto (AST). Esta ciência ocupa-se no desenvolvimento de sistemas informáticos para previsão de sentimento em grande quantidade de texto não estruturado. Por ser uma área recente, este subdomínio do Processamento de Linguagem Natural sofre de carência de recursos para o texto do domínio económico em Português. Face a esta realidade, com a preocupação de dotar o Português, a semelhança do Inglês, de conhecimento, ferramentas e recursos para AST no domínio económico, neste trabalho, verificou-se se os léxicos genéricos de AST em Português apresentam bons resultados quando são utilizados em domínio específico. Trabalhou-se particularmente com o domínio económico. Para tal, desenvolvemos o SentiSoft, sistema de AST. Utilizando bases de dados lexicais como Sentilex-Pt e OpLexicon, a taxa de acerto variou, nas experiências em texto genérico, entre 81% e 74%, portanto, em texto do domínio económico, abaixo do 35%. A variação do sentido semântico dos vocábulos em função do contexto foi apontado como principal causa deste insucesso. Deste modo, concluí-se que os léxicos genéricos em Português, não apresentam bons resultados quando são utilizados em domínios específicos e sugeriu-se a elaboração de um léxico exclusivo para o domínio económico.
publishDate 2018
dc.date.none.fl_str_mv 2018-11-22
2018-10-08
2018-11-22T00:00:00Z
2020-03-12T16:57:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.6/10020
TID:202355900
url http://hdl.handle.net/10400.6/10020
identifier_str_mv TID:202355900
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136391392657408