Mineração de opiniões comparativas em português
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/52746 |
Resumo: | The constant expansion of e-commerce, recently boosted due to the coronavirus pandemic, has led to a huge increase in online shopping, made by increasingly demanding customers, who seek comments and reviews on the Web to assist in decision-making regarding the purchase of products. In these reviews, part of the opinions found are comparisons, which contrast aspects expressing a preference for an object over others, allowing, for example, companies to know how customers compare their products to their competitors. However, this information is neglected by traditional sentiment analysis techniques, and it is not applicable for comparisons, since they do not directly express a positive or negative sentiment. In this context, despite efforts in the English language, almost no studies have been done to develop appropriate solutions that allow the analysis of comparisons in the Portuguese language. This work presents one of the first studies on comparative opinion in Portuguese. In general, this work contains two main contributions. First, a hierarchical approach for detecting comparisons was proposed, which consists of an initial binary step, which subdivides the regular opinions of the comparatives, to further categorize the comparatives into the five groups of opinions: (1) Non-Comparative; (2) Non-Equal Gradable; (3) Equative, (4) Superlative; and (5) Non-Gradable. The results obtained are promising, reaching 87% of Macro-F1 and 0.94 of AUC for the binary step, and 61% of Macro-F1 for classification in multiple classes. Finally, in the second contribution, an algorithm was proposed to detect the entity expressed as preferred in comparative sentences, reaching 94% of Macro-F1 for Superlative and almost 84% for Non-Equal Gradable opinions. |
id |
UFMG_fa7972e6db3d13f226d8db89b363a23d |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/52746 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Mineração de opiniões comparativas em portuguêsMining comparative opinions in portugueseMining portuguese comparative opinionsMineração de opiniãoAnálise de sentimentosProcessamento de linguagem naturalOpinião comparativaDetecção de preferênciaComputação – TesesMineração de opinião – TesesAnálise de sentimentos – TesesProcessamento de linguagem natural (Computacao) – TesesThe constant expansion of e-commerce, recently boosted due to the coronavirus pandemic, has led to a huge increase in online shopping, made by increasingly demanding customers, who seek comments and reviews on the Web to assist in decision-making regarding the purchase of products. In these reviews, part of the opinions found are comparisons, which contrast aspects expressing a preference for an object over others, allowing, for example, companies to know how customers compare their products to their competitors. However, this information is neglected by traditional sentiment analysis techniques, and it is not applicable for comparisons, since they do not directly express a positive or negative sentiment. In this context, despite efforts in the English language, almost no studies have been done to develop appropriate solutions that allow the analysis of comparisons in the Portuguese language. This work presents one of the first studies on comparative opinion in Portuguese. In general, this work contains two main contributions. First, a hierarchical approach for detecting comparisons was proposed, which consists of an initial binary step, which subdivides the regular opinions of the comparatives, to further categorize the comparatives into the five groups of opinions: (1) Non-Comparative; (2) Non-Equal Gradable; (3) Equative, (4) Superlative; and (5) Non-Gradable. The results obtained are promising, reaching 87% of Macro-F1 and 0.94 of AUC for the binary step, and 61% of Macro-F1 for classification in multiple classes. Finally, in the second contribution, an algorithm was proposed to detect the entity expressed as preferred in comparative sentences, reaching 94% of Macro-F1 for Superlative and almost 84% for Non-Equal Gradable opinions.A constante expansão do comércio eletrônico, recentemente impulsionada pela pandemia de COVID-19, tem levado a um grande aumento no número de compras online, feitas por clientes cada vez mais exigentes, que buscam por comentários e revisões na Web para auxiliar na tomada de decisão sobre a compra de produtos. Nessas revisões, parte das opiniões encontradas são comparações, que contrastam aspectos expressando preferência a um objeto em relação a outros, o que permite, por exemplo, que empresas entendam como clientes comparam seus produtos aos de seus concorrentes. Essas informações muitas vezes são negligenciadas pelas técnicas tradicionais de análise de sentimentos, que quase sempre capturam apenas sentimentos positivos ou negativos associados a aspectos de produtos. Apesar de recentes esforços voltados para a língua inglesa, quase nenhum estudo foi feito para o desenvolvimento de soluções apropriadas que permitam a análise de comparações na língua portuguesa. Este trabalho apresenta um dos primeiros estudos sobre opiniões comparativas na língua portuguesa. De maneira geral, o trabalho contém duas principais contribuições. Primeiramente, foi proposta uma abordagem hierárquica para a detecção de comparações, que consiste em uma etapa binária inicial, que subdivide as opiniões regulares das comparativas, para posteriormente categorizar as comparativas nos cinco grupos detalhados de opiniões: (1) Não Comparativa; (2) Gradativa com Predileção; (3) Equitativa; (4) Superlativa; e (5) Não Gradativa. Os resultados obtidos se mostram promissores, alcançando 87% de Macro-F1 e 0,94 de AUC para a etapa binária, e 61% de Macro-F1 para a categorização em múltiplas classes. Por fim, na segunda contribuição, foi proposto um algoritmo para detecção da entidade expressa como preferida em sentenças comparativas, alcançando valores de 94% de Macro-F1 para as Superlativas e aproximadamente 84% para as Gradativas com Predileção.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal de Minas GeraisBrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGFabrício Benevenuto de Souzahttp://lattes.cnpq.br/7014991384513854Adriano César Machado PereiraFlávio Vinícius Diniz de FigueiredoKarin BeckerDaniel Pimentel Kansaon2023-05-03T14:38:05Z2023-05-03T14:38:05Z2021-02-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1843/527460000-0001-5990-1629porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2023-05-03T14:38:05Zoai:repositorio.ufmg.br:1843/52746Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2023-05-03T14:38:05Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.none.fl_str_mv |
Mineração de opiniões comparativas em português Mining comparative opinions in portuguese Mining portuguese comparative opinions |
title |
Mineração de opiniões comparativas em português |
spellingShingle |
Mineração de opiniões comparativas em português Daniel Pimentel Kansaon Mineração de opinião Análise de sentimentos Processamento de linguagem natural Opinião comparativa Detecção de preferência Computação – Teses Mineração de opinião – Teses Análise de sentimentos – Teses Processamento de linguagem natural (Computacao) – Teses |
title_short |
Mineração de opiniões comparativas em português |
title_full |
Mineração de opiniões comparativas em português |
title_fullStr |
Mineração de opiniões comparativas em português |
title_full_unstemmed |
Mineração de opiniões comparativas em português |
title_sort |
Mineração de opiniões comparativas em português |
author |
Daniel Pimentel Kansaon |
author_facet |
Daniel Pimentel Kansaon |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fabrício Benevenuto de Souza http://lattes.cnpq.br/7014991384513854 Adriano César Machado Pereira Flávio Vinícius Diniz de Figueiredo Karin Becker |
dc.contributor.author.fl_str_mv |
Daniel Pimentel Kansaon |
dc.subject.por.fl_str_mv |
Mineração de opinião Análise de sentimentos Processamento de linguagem natural Opinião comparativa Detecção de preferência Computação – Teses Mineração de opinião – Teses Análise de sentimentos – Teses Processamento de linguagem natural (Computacao) – Teses |
topic |
Mineração de opinião Análise de sentimentos Processamento de linguagem natural Opinião comparativa Detecção de preferência Computação – Teses Mineração de opinião – Teses Análise de sentimentos – Teses Processamento de linguagem natural (Computacao) – Teses |
description |
The constant expansion of e-commerce, recently boosted due to the coronavirus pandemic, has led to a huge increase in online shopping, made by increasingly demanding customers, who seek comments and reviews on the Web to assist in decision-making regarding the purchase of products. In these reviews, part of the opinions found are comparisons, which contrast aspects expressing a preference for an object over others, allowing, for example, companies to know how customers compare their products to their competitors. However, this information is neglected by traditional sentiment analysis techniques, and it is not applicable for comparisons, since they do not directly express a positive or negative sentiment. In this context, despite efforts in the English language, almost no studies have been done to develop appropriate solutions that allow the analysis of comparisons in the Portuguese language. This work presents one of the first studies on comparative opinion in Portuguese. In general, this work contains two main contributions. First, a hierarchical approach for detecting comparisons was proposed, which consists of an initial binary step, which subdivides the regular opinions of the comparatives, to further categorize the comparatives into the five groups of opinions: (1) Non-Comparative; (2) Non-Equal Gradable; (3) Equative, (4) Superlative; and (5) Non-Gradable. The results obtained are promising, reaching 87% of Macro-F1 and 0.94 of AUC for the binary step, and 61% of Macro-F1 for classification in multiple classes. Finally, in the second contribution, an algorithm was proposed to detect the entity expressed as preferred in comparative sentences, reaching 94% of Macro-F1 for Superlative and almost 84% for Non-Equal Gradable opinions. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-02-23 2023-05-03T14:38:05Z 2023-05-03T14:38:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/52746 0000-0001-5990-1629 |
url |
http://hdl.handle.net/1843/52746 |
identifier_str_mv |
0000-0001-5990-1629 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais Brasil ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Programa de Pós-Graduação em Ciência da Computação UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais Brasil ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Programa de Pós-Graduação em Ciência da Computação UFMG |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
repositorio@ufmg.br |
_version_ |
1816829588153565184 |