Uso de informações específicas de domínio em recomendações para turismo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-A2FNBM |
Resumo: | Sistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados. |
id |
UFMG_457002d660433bc50bae8751ba96835f |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-A2FNBM |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Adriano César Machado PereiraJussara Marques de AlmeidaJussara Marques de AlmeidaAnisio Mendes LacerdaMarcelo Garcia ManzatoMarcos Andre GoncalvesRuhan Bidart2019-08-12T20:41:55Z2019-08-12T20:41:55Z2015-08-21http://hdl.handle.net/1843/ESBF-A2FNBMSistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados.E-Tourism recommendation is the task of personalizing suggestion of destinations, points-of-interest and/or traveling routes to help tourists plan their trips. In this domain, most recommender systems rely on collaborative filtering information, and ignore side information associated with the items, such as text descriptions and distances between destinations. This dissertation aims at exploiting domain-specific side information in the context of destination recommender systems. Towards that goal, we propose a family of methods that takes into account domain-specific side information to recommend destinations (i.e., cities) to the user. More specifically, we consider two types of side information, namely textual reviews of attractions located in the target destination and geographic location. Experiments on a real-world dataset show that our best method greatly outperforms a number of relevant baselines with gains (in average precision) surpassing 10% in the top-10 recommendations.Universidade Federal de Minas GeraisUFMGSistemas de recomendaçãoe-turismoComputaçãoFatorização de MatrizesFeedback ImplícitoInformação AdicionalSistemas de RecomendaçãoTurismo EletrônicoUso de informações específicas de domínio em recomendações para turismoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALruhanbidart.pdfapplication/pdf2506668https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/1/ruhanbidart.pdf777726702b10a3a2b2a7c731e0a8ab01MD51TEXTruhanbidart.pdf.txtruhanbidart.pdf.txtExtracted texttext/plain135991https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/2/ruhanbidart.pdf.txt5216df7288b2325e5300dac976d5e9c1MD521843/ESBF-A2FNBM2019-11-14 19:50:22.514oai:repositorio.ufmg.br:1843/ESBF-A2FNBMRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T22:50:22Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Uso de informações específicas de domínio em recomendações para turismo |
title |
Uso de informações específicas de domínio em recomendações para turismo |
spellingShingle |
Uso de informações específicas de domínio em recomendações para turismo Ruhan Bidart Fatorização de Matrizes Feedback Implícito Informação Adicional Sistemas de Recomendação Turismo Eletrônico Sistemas de recomendação e-turismo Computação |
title_short |
Uso de informações específicas de domínio em recomendações para turismo |
title_full |
Uso de informações específicas de domínio em recomendações para turismo |
title_fullStr |
Uso de informações específicas de domínio em recomendações para turismo |
title_full_unstemmed |
Uso de informações específicas de domínio em recomendações para turismo |
title_sort |
Uso de informações específicas de domínio em recomendações para turismo |
author |
Ruhan Bidart |
author_facet |
Ruhan Bidart |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Adriano César Machado Pereira |
dc.contributor.advisor-co1.fl_str_mv |
Jussara Marques de Almeida |
dc.contributor.referee1.fl_str_mv |
Jussara Marques de Almeida |
dc.contributor.referee2.fl_str_mv |
Anisio Mendes Lacerda |
dc.contributor.referee3.fl_str_mv |
Marcelo Garcia Manzato |
dc.contributor.referee4.fl_str_mv |
Marcos Andre Goncalves |
dc.contributor.author.fl_str_mv |
Ruhan Bidart |
contributor_str_mv |
Adriano César Machado Pereira Jussara Marques de Almeida Jussara Marques de Almeida Anisio Mendes Lacerda Marcelo Garcia Manzato Marcos Andre Goncalves |
dc.subject.por.fl_str_mv |
Fatorização de Matrizes Feedback Implícito Informação Adicional Sistemas de Recomendação Turismo Eletrônico |
topic |
Fatorização de Matrizes Feedback Implícito Informação Adicional Sistemas de Recomendação Turismo Eletrônico Sistemas de recomendação e-turismo Computação |
dc.subject.other.pt_BR.fl_str_mv |
Sistemas de recomendação e-turismo Computação |
description |
Sistemas de Recomendação desempenham um papel chave no processo de decisão dos usuários em sistemas Web. No turismo, esses sistemas são largamente utilizados na recomendação de hotéis, atrações turísticas, acomodações, etc. Mais recentemente, sistemas de recomendação têm sido utilizados para prover serviços que auxiliem os usuários a criar seu plano de viagens. Um plano de viagens consiste de vários estágios, tais como: (i) escolha dos destinos, (ii) seleção de atrações turísticas, (iii) escolha de acomodações, (iv) escolha de rotas, entre outros. Esta dissertação possui como foco primeiro estágio, que consiste em recomendar um conjunto de cidades para o usuário. Duas estratégias para recomendação de cidades são desenvolvidas. A primeira utiliza filtragem colaborativa baseada em vizinhança para recomendar cidades, enquanto a segunda utiliza uma técnica de filtragem colaborativa do estado da arte baseada em fatores latentes. A estratégia baseada em vizinhança explora dois tipos de informações distintas: (i) co-ocorrência de cidades visitadas pelos usuários; (ii) avaliações feitas pelos usuários em uma segunda camada - as atrações das cidades, tendo como premissa a robustez quanto à esparsidade dos dados. Na estratégia baseada em fatores latentes, são explorados dois tipos de características: (i) textuais, que envolvem o texto das revisões feitas pelos usuários acerca das atrações das cidades; (ii) geográficas, que utiliza a posição geográfica das cidades como fator decisor para a a recomendação. Para as características textuais, são propostas quatro métricas distintas de modo a capturar o valor textual discriminativo das revisões feitas pelos usuários com relação às atrações. Para os atributos geográficos, explora-se a característica intrínseca de distância geográfica entre as cidades, de modo a tratar a proximidade geográfica e a co-ocorrência das cidades em um mesmo problema de otimização. Os métodos propostos foram avaliados em uma base de dados coletada do maior site de turismo do mundo, o TripAdvisor. Os resultados possuem ganhos significativos em precisão quando comparados ao estado-da-arte. Vale ressaltar que as técnicas propostas que envolvem fatores latentes são flexíveis, podendo ser utilizadas em outros cenários que exploram uma segunda camada de dados textuais ou mesmo que exploram características geográficas dos itens recomendados. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-08-21 |
dc.date.accessioned.fl_str_mv |
2019-08-12T20:41:55Z |
dc.date.available.fl_str_mv |
2019-08-12T20:41:55Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-A2FNBM |
url |
http://hdl.handle.net/1843/ESBF-A2FNBM |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/1/ruhanbidart.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-A2FNBM/2/ruhanbidart.pdf.txt |
bitstream.checksum.fl_str_mv |
777726702b10a3a2b2a7c731e0a8ab01 5216df7288b2325e5300dac976d5e9c1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589554273255424 |