A study about the influence of text specificity in the perceived helpfulness classification of online reviews
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFBA |
Texto Completo: | https://repositorio.ufba.br/handle/ri/34851 |
Resumo: | Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM. |
id |
UFBA-2_e728c5ff24da1172fb5c0fee1b2dafa2 |
---|---|
oai_identifier_str |
oai:repositorio.ufba.br:ri/34851 |
network_acronym_str |
UFBA-2 |
network_name_str |
Repositório Institucional da UFBA |
repository_id_str |
1932 |
spelling |
2022-03-03T15:26:17Z2022-03-032022-03-03T15:26:17Z2021-12-15LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.https://repositorio.ufba.br/handle/ri/34851Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.Online reviews are valuable sources of information to support the decision-making process, both for individuals and companies. Nevertheless, the large volume of reviews that have a low quality hinders the process of gathering helpful information from those reviews. Several retailers’ websites provide a voting system to allow customers to evaluate product reviews as helpful or not. However, those votes are often biased and most of the reviews do not receive any votes at all. Besides that, several websites do not even have this voting mechanism or any other component for organizing the reviews in terms of their helpfulness. Therefore, classifying reviews according to their helpfulness has paramount importance in facilitating access to truly informative content. In this context, previous studies have unveiled several features and architectures that are beneficial for the perceived helpfulness prediction. In the present work, we argue that text specificity, defined as the level of details expressed in a text, can influence the perception of review helpfulness and, consequently, can also be a novel useful linguistic aspect for modeling the helpfulness prediction. We proposed two approaches to incorporate the specificity aspect into helpfulness classification models: i) using hand-crafted features based on text specificity and ii) using the review specificity prediction as an auxiliary task in a Multitask Learning (MTL) setting. First, we conducted an unsupervised domain adaptation approach [Ko, Durrett and Li 2019] to label text specificity scores on sentences from online reviews automatically. To evaluate the different trained models using this approach, we proposed a measure named Specificity Prediction Evaluation (SPE), which is based on the assumption that, on average, reliable specific sentences tend to be longer than reliable general sentences [Li and Nenkova 2015]. For the 18 collections of online reviews used in all of our experiments, we could achieve more reliable specificity predictions, according to SPE, by varying only the training set size and the number of training epochs. Finally, we performed experiments to assess the performance of the helpfulness classification models using two neural architectures: Convolutional Neural Network (CNN) [Kim 2014] and Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. In summary, using balanced datasets, the perceived helpfulness classification models, embodied with text specificity - either as features or MTL - showed significantly higher precision results in comparison to a popular SVM baseline when using CNN. With BERT, the experiments showed that MTL outperformed the single-task models for most of the 18 datasets and both accuracy and precision were improved compared to the SVM baseline.Submitted by Beatriz Lima (beatrizsfslima@gmail.com) on 2022-02-24T23:57:14Z No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2022-03-03T15:26:17Z (GMT) No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Made available in DSpace on 2022-03-03T15:26:17Z (GMT). No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5) Previous issue date: 2021-12-15engUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de MatemáticaCNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREHelpfulness predictionText specificityOnline reviewsText classificationFeature engineeringMultitask learningOpinion miningNatural language processingPrevisão de utilidadeEspecificidade do textoAvaliações on-lineClassificação de textoEngenharia de recursosAprendizagem multitarefaMineração de opiniãoProcessamento de linguagem naturalMineração de dados (Computação)A study about the influence of text specificity in the perceived helpfulness classification of online reviewsUm estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas onlineinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisRios, Tatiane Nogueirahttp://lattes.cnpq.br/0851148137941240Pardo, Thiago Alexandre Salgueiro0000-0003-2111-1319http://lattes.cnpq.br/7078737101024368Marcacini, Ricardo Marcondes0000-0002-2309-3487http://lattes.cnpq.br/3272611282260295http://lattes.cnpq.br/9027884889915699Lima, Beatriz Santana Fagundes Souza deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfDissertação - Beatriz Limaapplication/pdf6406426https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf058773b31995db6abd2706687eff46acMD51LICENSElicense.txtlicense.txttext/plain1866https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52TEXTPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtExtracted texttext/plain276059https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt94e618f478751ee925b383bb61e0cc9cMD53ri/348512022-03-12 04:18:30.494oai:repositorio.ufba.br:ri/34851TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-03-12T07:18:30Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
dc.title.pt_BR.fl_str_mv |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
dc.title.alternative.pt_BR.fl_str_mv |
Um estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas online |
title |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
spellingShingle |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews Lima, Beatriz Santana Fagundes Souza de CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação) |
title_short |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
title_full |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
title_fullStr |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
title_full_unstemmed |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
title_sort |
A study about the influence of text specificity in the perceived helpfulness classification of online reviews |
author |
Lima, Beatriz Santana Fagundes Souza de |
author_facet |
Lima, Beatriz Santana Fagundes Souza de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Rios, Tatiane Nogueira |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0851148137941240 |
dc.contributor.referee1.fl_str_mv |
Pardo, Thiago Alexandre Salgueiro |
dc.contributor.referee1ID.fl_str_mv |
0000-0003-2111-1319 |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/7078737101024368 |
dc.contributor.referee2.fl_str_mv |
Marcacini, Ricardo Marcondes |
dc.contributor.referee2ID.fl_str_mv |
0000-0002-2309-3487 |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/3272611282260295 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/9027884889915699 |
dc.contributor.author.fl_str_mv |
Lima, Beatriz Santana Fagundes Souza de |
contributor_str_mv |
Rios, Tatiane Nogueira Pardo, Thiago Alexandre Salgueiro Marcacini, Ricardo Marcondes |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação) |
dc.subject.por.fl_str_mv |
Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação) |
description |
Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-12-15 |
dc.date.accessioned.fl_str_mv |
2022-03-03T15:26:17Z |
dc.date.available.fl_str_mv |
2022-03-03 2022-03-03T15:26:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufba.br/handle/ri/34851 |
identifier_str_mv |
LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021. |
url |
https://repositorio.ufba.br/handle/ri/34851 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação (PGCOMP) |
dc.publisher.initials.fl_str_mv |
UFBA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Matemática |
publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
instname_str |
Universidade Federal da Bahia (UFBA) |
instacron_str |
UFBA |
institution |
UFBA |
reponame_str |
Repositório Institucional da UFBA |
collection |
Repositório Institucional da UFBA |
bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt |
bitstream.checksum.fl_str_mv |
058773b31995db6abd2706687eff46ac 43cd690d6a359e86c1fe3d5b7cba0c9b 94e618f478751ee925b383bb61e0cc9c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
repository.mail.fl_str_mv |
|
_version_ |
1808459638762373120 |