A study about the influence of text specificity in the perceived helpfulness classification of online reviews

Detalhes bibliográficos
Autor(a) principal: Lima, Beatriz Santana Fagundes Souza de
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFBA
Texto Completo: https://repositorio.ufba.br/handle/ri/34851
Resumo: Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.
id UFBA-2_e728c5ff24da1172fb5c0fee1b2dafa2
oai_identifier_str oai:repositorio.ufba.br:ri/34851
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling 2022-03-03T15:26:17Z2022-03-032022-03-03T15:26:17Z2021-12-15LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.https://repositorio.ufba.br/handle/ri/34851Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.Online reviews are valuable sources of information to support the decision-making process, both for individuals and companies. Nevertheless, the large volume of reviews that have a low quality hinders the process of gathering helpful information from those reviews. Several retailers’ websites provide a voting system to allow customers to evaluate product reviews as helpful or not. However, those votes are often biased and most of the reviews do not receive any votes at all. Besides that, several websites do not even have this voting mechanism or any other component for organizing the reviews in terms of their helpfulness. Therefore, classifying reviews according to their helpfulness has paramount importance in facilitating access to truly informative content. In this context, previous studies have unveiled several features and architectures that are beneficial for the perceived helpfulness prediction. In the present work, we argue that text specificity, defined as the level of details expressed in a text, can influence the perception of review helpfulness and, consequently, can also be a novel useful linguistic aspect for modeling the helpfulness prediction. We proposed two approaches to incorporate the specificity aspect into helpfulness classification models: i) using hand-crafted features based on text specificity and ii) using the review specificity prediction as an auxiliary task in a Multitask Learning (MTL) setting. First, we conducted an unsupervised domain adaptation approach [Ko, Durrett and Li 2019] to label text specificity scores on sentences from online reviews automatically. To evaluate the different trained models using this approach, we proposed a measure named Specificity Prediction Evaluation (SPE), which is based on the assumption that, on average, reliable specific sentences tend to be longer than reliable general sentences [Li and Nenkova 2015]. For the 18 collections of online reviews used in all of our experiments, we could achieve more reliable specificity predictions, according to SPE, by varying only the training set size and the number of training epochs. Finally, we performed experiments to assess the performance of the helpfulness classification models using two neural architectures: Convolutional Neural Network (CNN) [Kim 2014] and Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. In summary, using balanced datasets, the perceived helpfulness classification models, embodied with text specificity - either as features or MTL - showed significantly higher precision results in comparison to a popular SVM baseline when using CNN. With BERT, the experiments showed that MTL outperformed the single-task models for most of the 18 datasets and both accuracy and precision were improved compared to the SVM baseline.Submitted by Beatriz Lima (beatrizsfslima@gmail.com) on 2022-02-24T23:57:14Z No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2022-03-03T15:26:17Z (GMT) No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Made available in DSpace on 2022-03-03T15:26:17Z (GMT). No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5) Previous issue date: 2021-12-15engUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de MatemáticaCNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREHelpfulness predictionText specificityOnline reviewsText classificationFeature engineeringMultitask learningOpinion miningNatural language processingPrevisão de utilidadeEspecificidade do textoAvaliações on-lineClassificação de textoEngenharia de recursosAprendizagem multitarefaMineração de opiniãoProcessamento de linguagem naturalMineração de dados (Computação)A study about the influence of text specificity in the perceived helpfulness classification of online reviewsUm estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas onlineinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisRios, Tatiane Nogueirahttp://lattes.cnpq.br/0851148137941240Pardo, Thiago Alexandre Salgueiro0000-0003-2111-1319http://lattes.cnpq.br/7078737101024368Marcacini, Ricardo Marcondes0000-0002-2309-3487http://lattes.cnpq.br/3272611282260295http://lattes.cnpq.br/9027884889915699Lima, Beatriz Santana Fagundes Souza deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfDissertação - Beatriz Limaapplication/pdf6406426https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf058773b31995db6abd2706687eff46acMD51LICENSElicense.txtlicense.txttext/plain1866https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52TEXTPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtExtracted texttext/plain276059https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt94e618f478751ee925b383bb61e0cc9cMD53ri/348512022-03-12 04:18:30.494oai:repositorio.ufba.br:ri/34851TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-03-12T07:18:30Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv A study about the influence of text specificity in the perceived helpfulness classification of online reviews
dc.title.alternative.pt_BR.fl_str_mv Um estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas online
title A study about the influence of text specificity in the perceived helpfulness classification of online reviews
spellingShingle A study about the influence of text specificity in the perceived helpfulness classification of online reviews
Lima, Beatriz Santana Fagundes Souza de
CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
Helpfulness prediction
Text specificity
Online reviews
Text classification
Feature engineering
Multitask learning
Opinion mining
Natural language processing
Previsão de utilidade
Especificidade do texto
Avaliações on-line
Classificação de texto
Engenharia de recursos
Aprendizagem multitarefa
Mineração de opinião
Processamento de linguagem natural
Mineração de dados (Computação)
title_short A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_full A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_fullStr A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_full_unstemmed A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_sort A study about the influence of text specificity in the perceived helpfulness classification of online reviews
author Lima, Beatriz Santana Fagundes Souza de
author_facet Lima, Beatriz Santana Fagundes Souza de
author_role author
dc.contributor.advisor1.fl_str_mv Rios, Tatiane Nogueira
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0851148137941240
dc.contributor.referee1.fl_str_mv Pardo, Thiago Alexandre Salgueiro
dc.contributor.referee1ID.fl_str_mv 0000-0003-2111-1319
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/7078737101024368
dc.contributor.referee2.fl_str_mv Marcacini, Ricardo Marcondes
dc.contributor.referee2ID.fl_str_mv 0000-0002-2309-3487
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/3272611282260295
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9027884889915699
dc.contributor.author.fl_str_mv Lima, Beatriz Santana Fagundes Souza de
contributor_str_mv Rios, Tatiane Nogueira
Pardo, Thiago Alexandre Salgueiro
Marcacini, Ricardo Marcondes
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
topic CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
Helpfulness prediction
Text specificity
Online reviews
Text classification
Feature engineering
Multitask learning
Opinion mining
Natural language processing
Previsão de utilidade
Especificidade do texto
Avaliações on-line
Classificação de texto
Engenharia de recursos
Aprendizagem multitarefa
Mineração de opinião
Processamento de linguagem natural
Mineração de dados (Computação)
dc.subject.por.fl_str_mv Helpfulness prediction
Text specificity
Online reviews
Text classification
Feature engineering
Multitask learning
Opinion mining
Natural language processing
Previsão de utilidade
Especificidade do texto
Avaliações on-line
Classificação de texto
Engenharia de recursos
Aprendizagem multitarefa
Mineração de opinião
Processamento de linguagem natural
Mineração de dados (Computação)
description Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.
publishDate 2021
dc.date.issued.fl_str_mv 2021-12-15
dc.date.accessioned.fl_str_mv 2022-03-03T15:26:17Z
dc.date.available.fl_str_mv 2022-03-03
2022-03-03T15:26:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/34851
identifier_str_mv LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.
url https://repositorio.ufba.br/handle/ri/34851
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação (PGCOMP) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Matemática
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf
https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt
https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt
bitstream.checksum.fl_str_mv 058773b31995db6abd2706687eff46ac
43cd690d6a359e86c1fe3d5b7cba0c9b
94e618f478751ee925b383bb61e0cc9c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1801502742488809472