A study about the influence of text specificity in the perceived helpfulness classification of online reviews

Lima, Beatriz Santana Fagundes Souza de

A study about the influence of text specificity in the perceived helpfulness classification of online reviews

Detalhes bibliográficos
Autor(a) principal:	Lima, Beatriz Santana Fagundes Souza de
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	eng
Título da fonte:	Repositório Institucional da UFBA
Texto Completo:	https://repositorio.ufba.br/handle/ri/34851
Resumo:	Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.

Metadados do item

id	UFBA-2_e728c5ff24da1172fb5c0fee1b2dafa2
oai_identifier_str	oai:repositorio.ufba.br:ri/34851
network_acronym_str	UFBA-2
network_name_str	Repositório Institucional da UFBA
repository_id_str	1932
spelling	2022-03-03T15:26:17Z2022-03-032022-03-03T15:26:17Z2021-12-15LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.https://repositorio.ufba.br/handle/ri/34851Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.Online reviews are valuable sources of information to support the decision-making process, both for individuals and companies. Nevertheless, the large volume of reviews that have a low quality hinders the process of gathering helpful information from those reviews. Several retailers’ websites provide a voting system to allow customers to evaluate product reviews as helpful or not. However, those votes are often biased and most of the reviews do not receive any votes at all. Besides that, several websites do not even have this voting mechanism or any other component for organizing the reviews in terms of their helpfulness. Therefore, classifying reviews according to their helpfulness has paramount importance in facilitating access to truly informative content. In this context, previous studies have unveiled several features and architectures that are beneficial for the perceived helpfulness prediction. In the present work, we argue that text specificity, defined as the level of details expressed in a text, can influence the perception of review helpfulness and, consequently, can also be a novel useful linguistic aspect for modeling the helpfulness prediction. We proposed two approaches to incorporate the specificity aspect into helpfulness classification models: i) using hand-crafted features based on text specificity and ii) using the review specificity prediction as an auxiliary task in a Multitask Learning (MTL) setting. First, we conducted an unsupervised domain adaptation approach [Ko, Durrett and Li 2019] to label text specificity scores on sentences from online reviews automatically. To evaluate the different trained models using this approach, we proposed a measure named Specificity Prediction Evaluation (SPE), which is based on the assumption that, on average, reliable specific sentences tend to be longer than reliable general sentences [Li and Nenkova 2015]. For the 18 collections of online reviews used in all of our experiments, we could achieve more reliable specificity predictions, according to SPE, by varying only the training set size and the number of training epochs. Finally, we performed experiments to assess the performance of the helpfulness classification models using two neural architectures: Convolutional Neural Network (CNN) [Kim 2014] and Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. In summary, using balanced datasets, the perceived helpfulness classification models, embodied with text specificity - either as features or MTL - showed significantly higher precision results in comparison to a popular SVM baseline when using CNN. With BERT, the experiments showed that MTL outperformed the single-task models for most of the 18 datasets and both accuracy and precision were improved compared to the SVM baseline.Submitted by Beatriz Lima (beatrizsfslima@gmail.com) on 2022-02-24T23:57:14Z No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2022-03-03T15:26:17Z (GMT) No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5)Made available in DSpace on 2022-03-03T15:26:17Z (GMT). No. of bitstreams: 1 PGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf: 6406426 bytes, checksum: 058773b31995db6abd2706687eff46ac (MD5) Previous issue date: 2021-12-15engUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de MatemáticaCNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREHelpfulness predictionText specificityOnline reviewsText classificationFeature engineeringMultitask learningOpinion miningNatural language processingPrevisão de utilidadeEspecificidade do textoAvaliações on-lineClassificação de textoEngenharia de recursosAprendizagem multitarefaMineração de opiniãoProcessamento de linguagem naturalMineração de dados (Computação)A study about the influence of text specificity in the perceived helpfulness classification of online reviewsUm estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas onlineinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisRios, Tatiane Nogueirahttp://lattes.cnpq.br/0851148137941240Pardo, Thiago Alexandre Salgueiro0000-0003-2111-1319http://lattes.cnpq.br/7078737101024368Marcacini, Ricardo Marcondes0000-0002-2309-3487http://lattes.cnpq.br/3272611282260295http://lattes.cnpq.br/9027884889915699Lima, Beatriz Santana Fagundes Souza deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdfDissertação - Beatriz Limaapplication/pdf6406426https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf058773b31995db6abd2706687eff46acMD51LICENSElicense.txtlicense.txttext/plain1866https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52TEXTPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtPGCOMP-2021-Dissertação_Mestrado-Beatriz_Santana_Fagundes.pdf.txtExtracted texttext/plain276059https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt94e618f478751ee925b383bb61e0cc9cMD53ri/348512022-03-12 04:18:30.494oai:repositorio.ufba.br:ri/34851TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-03-12T07:18:30Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
dc.title.alternative.pt_BR.fl_str_mv	Um estudo sobre a influência da especificidade do texto na classificação de utilidade percebida de resenhas online
title	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
spellingShingle	A study about the influence of text specificity in the perceived helpfulness classification of online reviews Lima, Beatriz Santana Fagundes Souza de CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação)
title_short	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_full	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_fullStr	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_full_unstemmed	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
title_sort	A study about the influence of text specificity in the perceived helpfulness classification of online reviews
author	Lima, Beatriz Santana Fagundes Souza de
author_facet	Lima, Beatriz Santana Fagundes Souza de
author_role	author
dc.contributor.advisor1.fl_str_mv	Rios, Tatiane Nogueira
dc.contributor.advisor1Lattes.fl_str_mv	http://lattes.cnpq.br/0851148137941240
dc.contributor.referee1.fl_str_mv	Pardo, Thiago Alexandre Salgueiro
dc.contributor.referee1ID.fl_str_mv	0000-0003-2111-1319
dc.contributor.referee1Lattes.fl_str_mv	http://lattes.cnpq.br/7078737101024368
dc.contributor.referee2.fl_str_mv	Marcacini, Ricardo Marcondes
dc.contributor.referee2ID.fl_str_mv	0000-0002-2309-3487
dc.contributor.referee2Lattes.fl_str_mv	http://lattes.cnpq.br/3272611282260295
dc.contributor.authorLattes.fl_str_mv	http://lattes.cnpq.br/9027884889915699
dc.contributor.author.fl_str_mv	Lima, Beatriz Santana Fagundes Souza de
contributor_str_mv	Rios, Tatiane Nogueira Pardo, Thiago Alexandre Salgueiro Marcacini, Ricardo Marcondes
dc.subject.cnpq.fl_str_mv	CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
topic	CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação)
dc.subject.por.fl_str_mv	Helpfulness prediction Text specificity Online reviews Text classification Feature engineering Multitask learning Opinion mining Natural language processing Previsão de utilidade Especificidade do texto Avaliações on-line Classificação de texto Engenharia de recursos Aprendizagem multitarefa Mineração de opinião Processamento de linguagem natural Mineração de dados (Computação)
description	Avaliações online são fontes de informação valiosas para auxiliar no processo de tomada de decisão, tanto para indivíduos quanto para empresas. No entanto, o grande volume de avaliações que têm baixa qualidade prejudica o processo de obter informações úteis dessas avaliações. Diversos websites de venda online oferecem um sistema de votação para permitir que consumidores classifiquem avaliações sobre produtos como úteis ou não-úteis. Contudo, esses votos costumam ser tendenciosos e a maioria das avaliações não recebe um voto sequer. Além disso, vários websites nem possuem esse mecanismo de votação ou qualquer outra funcionalidade para organizar as avaliações com base na sua utilidade. Portanto, classificar avaliações de acordo com sua utilidade é uma tarefa primordial para facilitar o acesso a um conteúdo verdadeiramente informativo. Nesse contexto, estudos anteriores desvendaram vários atributos e arquiteturas que são benéficos para a tarefa de predição da utilidade percebida. Neste trabalho, nós argumentamos que a especificidade textual, definida como o nível de detalhes expresso em um texto, pode influenciar a percepção da utilidade de avaliações e, consequentemente, pode ser também um novo aspecto linguístico relevante para modelar a predição da utilidade. Nós elaboramos duas abordagens para incorporar a especificidade nos modelos de classificação de utilidade: i) como atributos baseados na especificidade textual e ii) usando a predição da especificidade de avaliações como uma tarefa auxiliar em um modelo de Aprendizado Multitarefa (MTL). Primeiro, nós conduzimos experimentos com uma abordagem de adaptação de domínio não-supervisionada [Ko, Durrett and Li 2019] para rotular automaticamente o grau de especificidade em frases de avaliações online. Para avaliar os diferentes modelos treinados usando essa abordagem, nós propusemos uma medida chamada Specificity Prediction Evaluation (SPE), que é baseada na suposição que, em média, frases específicas tendem a ser mais longas que frases genéricas [Li and Nenkova 2015]. Para as 18 coleções de avaliações online usadas em todos os nossos experimentos, nós alcançamos predições de especificidade mais confiáveis, de acordo com o SPE, variando apenas o tamanho do conjunto de treinamento e o número de épocas de treinamento. Por fim, nós realizamos experimentos para avaliar a performance dos modelos de classificação de utilidade usando duas arquiteturas neurais: Convolutional Neural Network (CNN) [Kim 2014] e Bidirectional Encoder Representations from Transformers (BERT) [Devlin et al. 2019]. Em resumo, utilizando conjuntos de dados balanceados, os modelos CNN de classificação de utilidade percebida, incorporados com a especificidade textual - seja como atributos ou MTL - mostraram resultados de precisão significativamente maiores em comparação com um conhecido baseline usando SVM. Com o BERT, os experimentos mostraram que o MTL teve uma performance superior aos modelos Single-task Learning (STL) para a maioria dos 18 conjuntos de dados e tanto acurácia quanto precisão foram superiores em comparação com o SVM.
publishDate	2021
dc.date.issued.fl_str_mv	2021-12-15
dc.date.accessioned.fl_str_mv	2022-03-03T15:26:17Z
dc.date.available.fl_str_mv	2022-03-03 2022-03-03T15:26:17Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.
dc.identifier.uri.fl_str_mv	https://repositorio.ufba.br/handle/ri/34851
identifier_str_mv	LIMA, Beatriz Santana Fagundes Souza de. A study about the influence of text specificity in the perceived helpfulness classification of online reviews. 2021. 105 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador, Bahia, 2021.
url	https://repositorio.ufba.br/handle/ri/34851
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal da Bahia
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação em Ciência da Computação (PGCOMP)
dc.publisher.initials.fl_str_mv	UFBA
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Instituto de Matemática
publisher.none.fl_str_mv	Universidade Federal da Bahia
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA
instname_str	Universidade Federal da Bahia (UFBA)
instacron_str	UFBA
institution	UFBA
reponame_str	Repositório Institucional da UFBA
collection	Repositório Institucional da UFBA
bitstream.url.fl_str_mv	https://repositorio.ufba.br/bitstream/ri/34851/1/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf https://repositorio.ufba.br/bitstream/ri/34851/2/license.txt https://repositorio.ufba.br/bitstream/ri/34851/3/PGCOMP-2021-Dissertac%cc%a7a%cc%83o_Mestrado-Beatriz_Santana_Fagundes.pdf.txt
bitstream.checksum.fl_str_mv	058773b31995db6abd2706687eff46ac 43cd690d6a359e86c1fe3d5b7cba0c9b 94e618f478751ee925b383bb61e0cc9c
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_	1808459638762373120

A study about the influence of text specificity in the perceived helpfulness classification of online reviews

Registros relacionados