Análise de sentimento em artigos de opinião

Detalhes bibliográficos
Autor(a) principal: Silva, Fatima
Data de Publicação: 2018
Outros Autores: Silvano, Purificação, Leal, António, Oliveira, Fátima, Brazdil, Pavel, Cordeiro, João, Oliveira, Débora
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.6/9090
Resumo: O estudo apresentado realiza-se na interface entre a linguística e as ciências da computação, tendo como objetivo fazer a análise computacional de artigos de opinião na área da economia e finanças, seguindo o quadro teórico da análise de sentimento. Os principais objetivos do trabalho são i) determinar a orientação do sentimento, positivo ou negativo, e a intensidade dessa orientação através da anotação da polaridade do léxico, com incidência nos nomes e adjetivos, nos segmentos em que ocorre a expressão da opinião, e ii) verificar se um léxico específico para a área de economia e finanças tem vantagens na atribuição automática de sentimento sobre um léxico geral. Para atingir esses objetivos, foiselecionado um corpus de 45 textos, analisado em duas fases por anotadores com formação distinta. Primeiro, uma amostra de 10 textos foi obtida e anotada pelos investigadores da área de linguística, coautores deste artigo, com o objetivo de desenvolver um modelo linguístico para determinar a orientação e intensidade da polaridade de termos em artigos de opinião e extrair termos de léxico relevantes para esta área de estudo. Em seguida, um conjunto de 35 textos foi anotado por estudantes universitários, seguindo o método utilizado na primeira amostra. Com base na anotação linguística, a equipa das ciências da computação procurou determinar até que ponto um léxico de sentimento geral para a língua portuguesa – SentiLex - é suficiente para caracterizar o sentimento de uma frase de maneira satisfatória ou se o EconoLex, um léxico específico de sentimento, seria mais eficaz. O léxico específico inclui termos e expressões multipalavra relevantes para o domínio da economia e finanças e para a língua portuguesa, e foi elaborado pelos autores deste estudo. Os dados foram analisados usando uma metodologia mista, qualitativa e quantitativa. Os resultados obtidos permitem-nos considerar os seguintes itens como contributos desta investigação: i) a elaboração do modelo de anotação linguística adotado para a análise da orientação e da intensidade da polaridade do léxico, em especial dos nomes e adjetivos; ii) o papel central, ainda que não exclusivo, dos adjetivos para a determinação da polaridade do sentimento nos segmentos opinativos dos artigos do corpus; iii) o desenvolvimento de um novo léxico de sentimento específico português para a área da economia e finanças; iv) a melhoria do desempenho computacional do EconoLex⨁SentiLex em relação ao SentiLex no que se refere ao desempenho na caracterização automática de sentimento. Apesar destes resultados positivos, há algumas limitações que constituem os elementos a desenvolver na continuidade deste trabalho interdisciplinar, nomeadamente a análise linguística mais detalhada das classes gramaticais estudadas, a consideração de outros elementos/estruturas linguísticas determinantes para a caracterização do sentimento em SN/ frase, o alargamento do corpus, o aumento do léxico específico do domínio e a afinação dos métodos automáticos de identificação de termos de sentimento em textos de opinião e determinação da sua intensidade.
id RCAP_e19019456fdf69ca9b118941111a43e0
oai_identifier_str oai:ubibliorum.ubi.pt:10400.6/9090
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise de sentimento em artigos de opiniãoSentiment analysisOpinion articleAutomatic assignment of sentimentEconomics and financePolarity and strengthLexiconEconolexO estudo apresentado realiza-se na interface entre a linguística e as ciências da computação, tendo como objetivo fazer a análise computacional de artigos de opinião na área da economia e finanças, seguindo o quadro teórico da análise de sentimento. Os principais objetivos do trabalho são i) determinar a orientação do sentimento, positivo ou negativo, e a intensidade dessa orientação através da anotação da polaridade do léxico, com incidência nos nomes e adjetivos, nos segmentos em que ocorre a expressão da opinião, e ii) verificar se um léxico específico para a área de economia e finanças tem vantagens na atribuição automática de sentimento sobre um léxico geral. Para atingir esses objetivos, foiselecionado um corpus de 45 textos, analisado em duas fases por anotadores com formação distinta. Primeiro, uma amostra de 10 textos foi obtida e anotada pelos investigadores da área de linguística, coautores deste artigo, com o objetivo de desenvolver um modelo linguístico para determinar a orientação e intensidade da polaridade de termos em artigos de opinião e extrair termos de léxico relevantes para esta área de estudo. Em seguida, um conjunto de 35 textos foi anotado por estudantes universitários, seguindo o método utilizado na primeira amostra. Com base na anotação linguística, a equipa das ciências da computação procurou determinar até que ponto um léxico de sentimento geral para a língua portuguesa – SentiLex - é suficiente para caracterizar o sentimento de uma frase de maneira satisfatória ou se o EconoLex, um léxico específico de sentimento, seria mais eficaz. O léxico específico inclui termos e expressões multipalavra relevantes para o domínio da economia e finanças e para a língua portuguesa, e foi elaborado pelos autores deste estudo. Os dados foram analisados usando uma metodologia mista, qualitativa e quantitativa. Os resultados obtidos permitem-nos considerar os seguintes itens como contributos desta investigação: i) a elaboração do modelo de anotação linguística adotado para a análise da orientação e da intensidade da polaridade do léxico, em especial dos nomes e adjetivos; ii) o papel central, ainda que não exclusivo, dos adjetivos para a determinação da polaridade do sentimento nos segmentos opinativos dos artigos do corpus; iii) o desenvolvimento de um novo léxico de sentimento específico português para a área da economia e finanças; iv) a melhoria do desempenho computacional do EconoLex⨁SentiLex em relação ao SentiLex no que se refere ao desempenho na caracterização automática de sentimento. Apesar destes resultados positivos, há algumas limitações que constituem os elementos a desenvolver na continuidade deste trabalho interdisciplinar, nomeadamente a análise linguística mais detalhada das classes gramaticais estudadas, a consideração de outros elementos/estruturas linguísticas determinantes para a caracterização do sentimento em SN/ frase, o alargamento do corpus, o aumento do léxico específico do domínio e a afinação dos métodos automáticos de identificação de termos de sentimento em textos de opinião e determinação da sua intensidade.The present study, which is developed in the interface between linguistics and computer science within the framework of sentiment analysis, aims at making a computational analysis of opinion articles in the area of economics and finance. The main objectives of the study are: i) to determine the semantic orientation of text segments that express opinion by annotating the polarity (positive or negative) and the strength (scale from -3 to 3) of nouns and adjectives, and ii) to verify if a specific lexicon for the area of economics and finance has advantages in automatic annotation of sentiment over a general lexicon. To achieve these objectives, a corpus of 45 texts was selected and analyzed in 2 phases, by annotators with different training. First, a sample of 10 texts was annotated by linguists, co-authors of this paper, with the objective of developing a linguistic annotation model to ascertain the polarity and strength of words in opinion articles and extract the relevant words for this area of study. Then, a set of 35 texts was annotated by university students, replicating the annotation model developed during the first phase. Based on the linguistic annotation, the computer science team tried to establish to what extent a general sentiment lexicon for Portuguese - SentiLex - was sufficient to extract the sentiment of a sentence in a satisfactory manner or whether EconoLex, a specific sentiment lexicon, would be more efficient. The specific lexicon includes terms and multiword expressions that are relevant to the area of economics and finance and to Portuguese language, and it was developed by the authors of this study. The data was analyzed according to a blending methodology, qualitative and quantitative. The results of the analysis allow us to consider the following items as contributes of this study: i) the development of a linguistic annotation model for the analysis of the polarity and strength of the lexicon, especially of nouns and adjectives; ii) the key role, though not exclusive, of the adjectives to determine the polarity of opinion segments of the corpus articles; iii) the creation of a new specific sentiment lexicon for Portuguese in the area of economics and finance; iv) the improvement of the computational performance of EconoLex⨁SentiLex in relation to SentiLex regarding the performance in automatic annotation of sentiment. In spite of these positive results, there are some limitations, which we intend to overcome in the continuity of this interdisciplinary work, namely a more detailed linguistic analysis of the word classes that we studied, the consideration of other elements/ linguistic structures that are essential to ascertain the sentiment in NP/sentence, the extension of the corpus, the expansion of the specific lexicon of the area of economics and finance and the improvement of automatic methods for identifying evaluative words in texts of opinion and for assigning them polarity and strength.Revista de Estudos Linguísticos da Univerdade do PortouBibliorumSilva, FatimaSilvano, PurificaçãoLeal, AntónioOliveira, FátimaBrazdil, PavelCordeiro, JoãoOliveira, Débora2020-02-06T17:26:35Z2018-102018-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/10400.6/9090porSilva, M., Silvano, P., Leal A., Oliveira, F., Brazdil, P., Cordeiro, J., and Oliveira, D. (2018). Análise de sentimento em artigos de opinião. Revista de Estudos Linguísticos da Universidade do Porto. Volume 13, pp. 79--114. UP, Centro de Linguística, outubro de 2018. ISSN:1646-61951646-6195info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-15T09:49:47Zoai:ubibliorum.ubi.pt:10400.6/9090Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T00:49:19.977927Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise de sentimento em artigos de opinião
title Análise de sentimento em artigos de opinião
spellingShingle Análise de sentimento em artigos de opinião
Silva, Fatima
Sentiment analysis
Opinion article
Automatic assignment of sentiment
Economics and finance
Polarity and strength
Lexicon
Econolex
title_short Análise de sentimento em artigos de opinião
title_full Análise de sentimento em artigos de opinião
title_fullStr Análise de sentimento em artigos de opinião
title_full_unstemmed Análise de sentimento em artigos de opinião
title_sort Análise de sentimento em artigos de opinião
author Silva, Fatima
author_facet Silva, Fatima
Silvano, Purificação
Leal, António
Oliveira, Fátima
Brazdil, Pavel
Cordeiro, João
Oliveira, Débora
author_role author
author2 Silvano, Purificação
Leal, António
Oliveira, Fátima
Brazdil, Pavel
Cordeiro, João
Oliveira, Débora
author2_role author
author
author
author
author
author
dc.contributor.none.fl_str_mv uBibliorum
dc.contributor.author.fl_str_mv Silva, Fatima
Silvano, Purificação
Leal, António
Oliveira, Fátima
Brazdil, Pavel
Cordeiro, João
Oliveira, Débora
dc.subject.por.fl_str_mv Sentiment analysis
Opinion article
Automatic assignment of sentiment
Economics and finance
Polarity and strength
Lexicon
Econolex
topic Sentiment analysis
Opinion article
Automatic assignment of sentiment
Economics and finance
Polarity and strength
Lexicon
Econolex
description O estudo apresentado realiza-se na interface entre a linguística e as ciências da computação, tendo como objetivo fazer a análise computacional de artigos de opinião na área da economia e finanças, seguindo o quadro teórico da análise de sentimento. Os principais objetivos do trabalho são i) determinar a orientação do sentimento, positivo ou negativo, e a intensidade dessa orientação através da anotação da polaridade do léxico, com incidência nos nomes e adjetivos, nos segmentos em que ocorre a expressão da opinião, e ii) verificar se um léxico específico para a área de economia e finanças tem vantagens na atribuição automática de sentimento sobre um léxico geral. Para atingir esses objetivos, foiselecionado um corpus de 45 textos, analisado em duas fases por anotadores com formação distinta. Primeiro, uma amostra de 10 textos foi obtida e anotada pelos investigadores da área de linguística, coautores deste artigo, com o objetivo de desenvolver um modelo linguístico para determinar a orientação e intensidade da polaridade de termos em artigos de opinião e extrair termos de léxico relevantes para esta área de estudo. Em seguida, um conjunto de 35 textos foi anotado por estudantes universitários, seguindo o método utilizado na primeira amostra. Com base na anotação linguística, a equipa das ciências da computação procurou determinar até que ponto um léxico de sentimento geral para a língua portuguesa – SentiLex - é suficiente para caracterizar o sentimento de uma frase de maneira satisfatória ou se o EconoLex, um léxico específico de sentimento, seria mais eficaz. O léxico específico inclui termos e expressões multipalavra relevantes para o domínio da economia e finanças e para a língua portuguesa, e foi elaborado pelos autores deste estudo. Os dados foram analisados usando uma metodologia mista, qualitativa e quantitativa. Os resultados obtidos permitem-nos considerar os seguintes itens como contributos desta investigação: i) a elaboração do modelo de anotação linguística adotado para a análise da orientação e da intensidade da polaridade do léxico, em especial dos nomes e adjetivos; ii) o papel central, ainda que não exclusivo, dos adjetivos para a determinação da polaridade do sentimento nos segmentos opinativos dos artigos do corpus; iii) o desenvolvimento de um novo léxico de sentimento específico português para a área da economia e finanças; iv) a melhoria do desempenho computacional do EconoLex⨁SentiLex em relação ao SentiLex no que se refere ao desempenho na caracterização automática de sentimento. Apesar destes resultados positivos, há algumas limitações que constituem os elementos a desenvolver na continuidade deste trabalho interdisciplinar, nomeadamente a análise linguística mais detalhada das classes gramaticais estudadas, a consideração de outros elementos/estruturas linguísticas determinantes para a caracterização do sentimento em SN/ frase, o alargamento do corpus, o aumento do léxico específico do domínio e a afinação dos métodos automáticos de identificação de termos de sentimento em textos de opinião e determinação da sua intensidade.
publishDate 2018
dc.date.none.fl_str_mv 2018-10
2018-10-01T00:00:00Z
2020-02-06T17:26:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.6/9090
url http://hdl.handle.net/10400.6/9090
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Silva, M., Silvano, P., Leal A., Oliveira, F., Brazdil, P., Cordeiro, J., and Oliveira, D. (2018). Análise de sentimento em artigos de opinião. Revista de Estudos Linguísticos da Universidade do Porto. Volume 13, pp. 79--114. UP, Centro de Linguística, outubro de 2018. ISSN:1646-6195
1646-6195
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Revista de Estudos Linguísticos da Univerdade do Porto
publisher.none.fl_str_mv Revista de Estudos Linguísticos da Univerdade do Porto
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136385844641792