Stripping customers' feedback on hotels evaluation through data mining

Detalhes bibliográficos
Autor(a) principal: Coelho, Joana Pinto
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10071/14047
Resumo: Com a constante evolução tecnológica e a consequente afluência de partilha de informação entre os consumidores, as plataformas online, como é o caso do TripAdvisor, começaram a ser usadas para análise, principalmente na indústria hoteleira. Estas plataformas permitem aos clientes a partilha de opiniões e a respectiva atribuição de uma avaliação quantitativa aos hotéis visitados. Os estudos publicados têm-se focado, fundamentalmente, na análise dos comentários; contudo, estudos relacionados com a avaliação quantitativa são mais escassos. Este estudo foi desenvolvido através de técnicas de data mining por forma a modelar a pontuação atribuída no TripAdvisor. Foram recolhidos dois comentários por cada mês do ano de 2015 referentes a 21 hotéis localizados na avenida mais emblemática de Las Vegas, a Strip, num total de 504 comentários. A localização foi seleccionada por ser um destino de elevado impato turístico já que a cidade persiste devido à hotelaria e aos casinos. Foram seleccionadas 19 variáveis que representam o utilizador, o hotel e as suas características para alimentarem uma máquina de vectores de suporte objectivando a modelação da avaliação quantitativa para extração de conhecimento. Os resultados atestaram a utilidade do modelo na sua capacidade preditiva. Após esta validação foi aplicada uma análise de sensibilidade ao modelo para compreender a relevância das variáveis. Os resultados revelaram que as variáveis diretamente relacionadas com o utilizador e a sua experiência na utilização do TripAdvisor têm maior influência na atribuição das pontuações, comparativamente com as variáveis relacionadas com o hotel.
id RCAP_66e491593017773ebd9e9c5c33eb23a9
oai_identifier_str oai:repositorio.iscte-iul.pt:10071/14047
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Stripping customers' feedback on hotels evaluation through data miningIndústria hoteleiraTurismoDATA MININGMarketingCustomer feedbackCustomer reviewsOnline reviewsKnowledge extractionModelingSensitivity analysisLas VegasCom a constante evolução tecnológica e a consequente afluência de partilha de informação entre os consumidores, as plataformas online, como é o caso do TripAdvisor, começaram a ser usadas para análise, principalmente na indústria hoteleira. Estas plataformas permitem aos clientes a partilha de opiniões e a respectiva atribuição de uma avaliação quantitativa aos hotéis visitados. Os estudos publicados têm-se focado, fundamentalmente, na análise dos comentários; contudo, estudos relacionados com a avaliação quantitativa são mais escassos. Este estudo foi desenvolvido através de técnicas de data mining por forma a modelar a pontuação atribuída no TripAdvisor. Foram recolhidos dois comentários por cada mês do ano de 2015 referentes a 21 hotéis localizados na avenida mais emblemática de Las Vegas, a Strip, num total de 504 comentários. A localização foi seleccionada por ser um destino de elevado impato turístico já que a cidade persiste devido à hotelaria e aos casinos. Foram seleccionadas 19 variáveis que representam o utilizador, o hotel e as suas características para alimentarem uma máquina de vectores de suporte objectivando a modelação da avaliação quantitativa para extração de conhecimento. Os resultados atestaram a utilidade do modelo na sua capacidade preditiva. Após esta validação foi aplicada uma análise de sensibilidade ao modelo para compreender a relevância das variáveis. Os resultados revelaram que as variáveis diretamente relacionadas com o utilizador e a sua experiência na utilização do TripAdvisor têm maior influência na atribuição das pontuações, comparativamente com as variáveis relacionadas com o hotel.The emergence of online reviews’ platforms such as TripAdvisor provided tools for tourists to write their opinions and rate hotels with a quantitative score. While numerous studies are found based on textual comments of users, research on the score is rather scarce. This study presents a data mining approach for modeling TripAdvisor score using 504 reviews published in 2015 for the 21 hotels located in the Strip, Las Vegas. Nineteen features characterizing the reviews, hotels and the users were prepared and used for feeding a support vector machine for modeling the score. The results achieved reveal the model is a good approximation for predicting the score. Therefore, a sensitivity analysis was applied over the model for extracting useful knowledge translated into features’ relevance for the score. The findings unveiled user features related to TripAdvisor membership experience play a key role in influencing the scores granted, clearly surpassing hotel features.2017-07-14T16:33:39Z2016-11-09T00:00:00Z2016-11-092016-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/octet-streamhttp://hdl.handle.net/10071/14047TID:201556847engCoelho, Joana Pintoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-09T17:43:57Zoai:repositorio.iscte-iul.pt:10071/14047Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T22:20:47.946478Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Stripping customers' feedback on hotels evaluation through data mining
title Stripping customers' feedback on hotels evaluation through data mining
spellingShingle Stripping customers' feedback on hotels evaluation through data mining
Coelho, Joana Pinto
Indústria hoteleira
Turismo
DATA MINING
Marketing
Customer feedback
Customer reviews
Online reviews
Knowledge extraction
Modeling
Sensitivity analysis
Las Vegas
title_short Stripping customers' feedback on hotels evaluation through data mining
title_full Stripping customers' feedback on hotels evaluation through data mining
title_fullStr Stripping customers' feedback on hotels evaluation through data mining
title_full_unstemmed Stripping customers' feedback on hotels evaluation through data mining
title_sort Stripping customers' feedback on hotels evaluation through data mining
author Coelho, Joana Pinto
author_facet Coelho, Joana Pinto
author_role author
dc.contributor.author.fl_str_mv Coelho, Joana Pinto
dc.subject.por.fl_str_mv Indústria hoteleira
Turismo
DATA MINING
Marketing
Customer feedback
Customer reviews
Online reviews
Knowledge extraction
Modeling
Sensitivity analysis
Las Vegas
topic Indústria hoteleira
Turismo
DATA MINING
Marketing
Customer feedback
Customer reviews
Online reviews
Knowledge extraction
Modeling
Sensitivity analysis
Las Vegas
description Com a constante evolução tecnológica e a consequente afluência de partilha de informação entre os consumidores, as plataformas online, como é o caso do TripAdvisor, começaram a ser usadas para análise, principalmente na indústria hoteleira. Estas plataformas permitem aos clientes a partilha de opiniões e a respectiva atribuição de uma avaliação quantitativa aos hotéis visitados. Os estudos publicados têm-se focado, fundamentalmente, na análise dos comentários; contudo, estudos relacionados com a avaliação quantitativa são mais escassos. Este estudo foi desenvolvido através de técnicas de data mining por forma a modelar a pontuação atribuída no TripAdvisor. Foram recolhidos dois comentários por cada mês do ano de 2015 referentes a 21 hotéis localizados na avenida mais emblemática de Las Vegas, a Strip, num total de 504 comentários. A localização foi seleccionada por ser um destino de elevado impato turístico já que a cidade persiste devido à hotelaria e aos casinos. Foram seleccionadas 19 variáveis que representam o utilizador, o hotel e as suas características para alimentarem uma máquina de vectores de suporte objectivando a modelação da avaliação quantitativa para extração de conhecimento. Os resultados atestaram a utilidade do modelo na sua capacidade preditiva. Após esta validação foi aplicada uma análise de sensibilidade ao modelo para compreender a relevância das variáveis. Os resultados revelaram que as variáveis diretamente relacionadas com o utilizador e a sua experiência na utilização do TripAdvisor têm maior influência na atribuição das pontuações, comparativamente com as variáveis relacionadas com o hotel.
publishDate 2016
dc.date.none.fl_str_mv 2016-11-09T00:00:00Z
2016-11-09
2016-09
2017-07-14T16:33:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10071/14047
TID:201556847
url http://hdl.handle.net/10071/14047
identifier_str_mv TID:201556847
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/octet-stream
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134768003022848