Uso de informações específicas de domínio em recomendações para turismo

Detalhes bibliográficos
Autor(a) principal: Ruhan Bidart
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-A2FNBM
Resumo: Sistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados.
id UFMG_457002d660433bc50bae8751ba96835f
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-A2FNBM
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Adriano César Machado PereiraJussara Marques de AlmeidaJussara Marques de AlmeidaAnisio Mendes LacerdaMarcelo Garcia ManzatoMarcos Andre GoncalvesRuhan Bidart2019-08-12T20:41:55Z2019-08-12T20:41:55Z2015-08-21http://hdl.handle.net/1843/ESBF-A2FNBMSistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados.E-Tourism recommendation is the task of personalizing suggestion of destinations, points-of-interest and/or traveling routes to help tourists plan their trips. In this domain, most recommender systems rely on collaborative filtering information, and ignore side information associated with the items, such as text descriptions and distances between destinations. This dissertation aims at exploiting domain-specific side information in the context of destination recommender systems. Towards that goal, we propose a family of methods that takes into account domain-specific side information to recommend destinations (i.e., cities) to the user. More specifically, we consider two types of side information, namely textual reviews of attractions located in the target destination and geographic location. Experiments on a real-world dataset show that our best method greatly outperforms a number of relevant baselines with gains (in average precision) surpassing 10% in the top-10 recommendations.Universidade Federal de Minas GeraisUFMGSistemas de recomendaçãoe-turismoComputaçãoFatorização de MatrizesFeedback ImplícitoInformação AdicionalSistemas de RecomendaçãoTurismo EletrônicoUso de informações específicas de domínio em recomendações para turismoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALruhanbidart.pdfapplication/pdf2506668https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/1/ruhanbidart.pdf777726702b10a3a2b2a7c731e0a8ab01MD51TEXTruhanbidart.pdf.txtruhanbidart.pdf.txtExtracted texttext/plain135991https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/2/ruhanbidart.pdf.txt5216df7288b2325e5300dac976d5e9c1MD521843/ESBF-A2FNBM2019-11-14 19:50:22.514oai:repositorio.ufmg.br:1843/ESBF-A2FNBMRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T22:50:22Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uso de informações específicas de domínio em recomendações para turismo
title Uso de informações específicas de domínio em recomendações para turismo
spellingShingle Uso de informações específicas de domínio em recomendações para turismo
Ruhan Bidart
Fatorização de Matrizes
Feedback Implícito
Informação Adicional
Sistemas de Recomendação
Turismo Eletrônico
Sistemas de recomendação
e-turismo
Computação
title_short Uso de informações específicas de domínio em recomendações para turismo
title_full Uso de informações específicas de domínio em recomendações para turismo
title_fullStr Uso de informações específicas de domínio em recomendações para turismo
title_full_unstemmed Uso de informações específicas de domínio em recomendações para turismo
title_sort Uso de informações específicas de domínio em recomendações para turismo
author Ruhan Bidart
author_facet Ruhan Bidart
author_role author
dc.contributor.advisor1.fl_str_mv Adriano César Machado Pereira
dc.contributor.advisor-co1.fl_str_mv Jussara Marques de Almeida
dc.contributor.referee1.fl_str_mv Jussara Marques de Almeida
dc.contributor.referee2.fl_str_mv Anisio Mendes Lacerda
dc.contributor.referee3.fl_str_mv Marcelo Garcia Manzato
dc.contributor.referee4.fl_str_mv Marcos Andre Goncalves
dc.contributor.author.fl_str_mv Ruhan Bidart
contributor_str_mv Adriano César Machado Pereira
Jussara Marques de Almeida
Jussara Marques de Almeida
Anisio Mendes Lacerda
Marcelo Garcia Manzato
Marcos Andre Goncalves
dc.subject.por.fl_str_mv Fatorização de Matrizes
Feedback Implícito
Informação Adicional
Sistemas de Recomendação
Turismo Eletrônico
topic Fatorização de Matrizes
Feedback Implícito
Informação Adicional
Sistemas de Recomendação
Turismo Eletrônico
Sistemas de recomendação
e-turismo
Computação
dc.subject.other.pt_BR.fl_str_mv Sistemas de recomendação
e-turismo
Computação
description Sistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados.
publishDate 2015
dc.date.issued.fl_str_mv 2015-08-21
dc.date.accessioned.fl_str_mv 2019-08-12T20:41:55Z
dc.date.available.fl_str_mv 2019-08-12T20:41:55Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-A2FNBM
url http://hdl.handle.net/1843/ESBF-A2FNBM
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/1/ruhanbidart.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/2/ruhanbidart.pdf.txt
bitstream.checksum.fl_str_mv 777726702b10a3a2b2a7c731e0a8ab01
5216df7288b2325e5300dac976d5e9c1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589554273255424