Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation

Detalhes bibliográficos
Autor(a) principal: Ticona, Gustavo Junior Escobedo
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-105306/
Resumo: Recommender systems are tools whose objective is to filter relevant content to users according to their preferences. Recently, due to the new demands of electronic business where most of users are not authenticated, Session-based recommender systems emerged. This approach models session data (e.g. sequences of interactions, item metadata) to predict which items will be relevant for the user during the current session. Session-aware approaches include representations from users past sessions to improve performance on fresh new sessions. However, current approaches only exploit these representations at the beginning of the session which in a long sequence of interactions does not take advantage of possible changes of interest during the same session. Consequently, in this research work, we explore the possibility of exploiting inter-session representations to improve recommendation performance. We proposed an adaptation of the Deep Deterministic Policy Gradient algorithm on a session-aware recommender model to train a policy that handles the interaction between the current intra-session state and inter-session representations. We performed several experiments on two datasets from different domains finding key factors that affect session-aware models performance. However, we could not find strong evidence to claim that inter-session dynamics can improve performance during long sequences of intra-session interactions.
id USP_eea00a4c1c25316785dd63959e4315a8
oai_identifier_str oai:teses.usp.br:tde-23062021-105306
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware RecommendationExplorando dinâmicas entre sessões para sequências longas de interações de sessão com Aprendizado por Reforço Profundo para Recomendação Ciente de SessãoAprendizado por reforço profundoDeep learningRecomendação ciente de sessãoRecommender systemsRedes neurais recorrentes hierarquicasReinforcement learningSession-aware recommendationSistemas de recomendaçãoRecommender systems are tools whose objective is to filter relevant content to users according to their preferences. Recently, due to the new demands of electronic business where most of users are not authenticated, Session-based recommender systems emerged. This approach models session data (e.g. sequences of interactions, item metadata) to predict which items will be relevant for the user during the current session. Session-aware approaches include representations from users past sessions to improve performance on fresh new sessions. However, current approaches only exploit these representations at the beginning of the session which in a long sequence of interactions does not take advantage of possible changes of interest during the same session. Consequently, in this research work, we explore the possibility of exploiting inter-session representations to improve recommendation performance. We proposed an adaptation of the Deep Deterministic Policy Gradient algorithm on a session-aware recommender model to train a policy that handles the interaction between the current intra-session state and inter-session representations. We performed several experiments on two datasets from different domains finding key factors that affect session-aware models performance. However, we could not find strong evidence to claim that inter-session dynamics can improve performance during long sequences of intra-session interactions.Sistemas de recomendação são ferramentas cujo objetivo é filtrar o conteúdo relevante para os usuários de acordo com suas preferências. Recentemente, devido às novas demandas de negócios eletrônicos em que a maioria dos usuários não estão autenticados, surgiram os sistemas de recomendação baseados em sessão. Esta abordagem modela dados da sessão (por exemplo, sequências de interações, metadados de itens) para predizer quais itens serão relevantes para o usuário durante a sessão atual. As abordagens cientes de sessão incluem representações de sessões anteriores de usuários para melhorar o desempenho em novas sessões. No entanto, eles usam apenas essas representações no início da sessão, sendo que em uma longa sequência de interações não aproveita as possíveis mudanças de interesse durante a propria sessão. Os modelos atuais pressupõem que essas mudanças ocorrem apenas no início de uma nova sessão, conseqüentemente neste trabalho de pesquisa exploramos a possibilidade de usar essas representações entre sessões para beneficiar o desempenho das recomendações durante sessões longas. Propusemos uma adaptação do algoritmo Deep Deterministic Policy Gradient em um modelo de recomendação ciente de sessão para treinar uma política que lida com a interação entre o estado intra-sessão atual e as representações inter-sessão. Realizamos experimentos em dois conjuntos de dados de diferentes domínios, encontrando os principais fatores que afetam o desempenho dos modelos cientes de sessão. No entanto, não pudemos encontrar evidências fortes para afirmar que as dinâmicas entre as sessões podem melhorar o desempenho durante longas sequências de interações entre as sessões.Biblioteca Digitais de Teses e Dissertações da USPManzato, Marcelo GarciaTicona, Gustavo Junior Escobedo2021-03-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-105306/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-06-23T17:11:02Zoai:teses.usp.br:tde-23062021-105306Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-06-23T17:11:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
Explorando dinâmicas entre sessões para sequências longas de interações de sessão com Aprendizado por Reforço Profundo para Recomendação Ciente de Sessão
title Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
spellingShingle Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
Ticona, Gustavo Junior Escobedo
Aprendizado por reforço profundo
Deep learning
Recomendação ciente de sessão
Recommender systems
Redes neurais recorrentes hierarquicas
Reinforcement learning
Session-aware recommendation
Sistemas de recomendação
title_short Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
title_full Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
title_fullStr Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
title_full_unstemmed Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
title_sort Exploiting Inter-session Dynamics for Long Intra-Session Sequences of Interactions with Deep Reinforcement Learning for Session-Aware Recommendation
author Ticona, Gustavo Junior Escobedo
author_facet Ticona, Gustavo Junior Escobedo
author_role author
dc.contributor.none.fl_str_mv Manzato, Marcelo Garcia
dc.contributor.author.fl_str_mv Ticona, Gustavo Junior Escobedo
dc.subject.por.fl_str_mv Aprendizado por reforço profundo
Deep learning
Recomendação ciente de sessão
Recommender systems
Redes neurais recorrentes hierarquicas
Reinforcement learning
Session-aware recommendation
Sistemas de recomendação
topic Aprendizado por reforço profundo
Deep learning
Recomendação ciente de sessão
Recommender systems
Redes neurais recorrentes hierarquicas
Reinforcement learning
Session-aware recommendation
Sistemas de recomendação
description Recommender systems are tools whose objective is to filter relevant content to users according to their preferences. Recently, due to the new demands of electronic business where most of users are not authenticated, Session-based recommender systems emerged. This approach models session data (e.g. sequences of interactions, item metadata) to predict which items will be relevant for the user during the current session. Session-aware approaches include representations from users past sessions to improve performance on fresh new sessions. However, current approaches only exploit these representations at the beginning of the session which in a long sequence of interactions does not take advantage of possible changes of interest during the same session. Consequently, in this research work, we explore the possibility of exploiting inter-session representations to improve recommendation performance. We proposed an adaptation of the Deep Deterministic Policy Gradient algorithm on a session-aware recommender model to train a policy that handles the interaction between the current intra-session state and inter-session representations. We performed several experiments on two datasets from different domains finding key factors that affect session-aware models performance. However, we could not find strong evidence to claim that inter-session dynamics can improve performance during long sequences of intra-session interactions.
publishDate 2021
dc.date.none.fl_str_mv 2021-03-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-105306/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-105306/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091016982003712