Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa

Detalhes bibliográficos
Autor(a) principal: Fernandes, Bruno Bandeira
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/204998
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
id UFSC_3806f7d862c30d99891017dc338cfafc
oai_identifier_str oai:repositorio.ufsc.br:123456789/204998
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativaComputaçãoSistemas de recomendação (filtragem de informações)Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.Os sistemas de recomendação (SRs) mais populares empregam algoritmos de Filtragem Colaborativa (FC) requerendo que usuários avaliem explicitamente os itens acessados por eles. Baseado nessas avaliações, uma matriz de avaliação Usuário-Item é gerada e usada para selecionar os itens a serem recomendados para um usuário-alvo. Uma etapa importante neste processo é determinar a vizinhança de um usuário-alvo, ou seja, um conjunto de usuários que classificaram os itens de forma similar ao usuário-alvo. Uma das limitações da FC é justamente a exigência de dados de avaliação fornecidos voluntariamente pelos usuários. Em muitos cenários, a falta de interesse dos usuários em fornecer esse tipo de dado aumenta o problema de esparsidade de dados na matriz de avaliação Usuário-Item. Este trabalho propõe o uso de realimentação implícita para a seleção de vizinhos próximos, para reduzir o problema de esparsidade em RSs baseados em FC. Nesta proposta, os Perfis de Usuários (PUs) são criados com base nas características dos itens acessados ou comprados pelos usuários e não necessariamente avaliados por esses usuários. Estes PUs são usados exclusivamente para a seleção de vizinhança, que, ao invés de considerar as avaliações dos itens, leva em consideração as características dos itens que os usuários acessaram ou compraram. A técnica foi implementada com o Framework Apache Mahout e avaliada nos domínios de filmes e livros. Para isto, foram usados os conjuntos de dados do projeto GroupLens. Os resultados demonstraram que a técnica proposta produz recomendações de melhor qualidade em termos de predição das recomendações quando comparadas às FC clássicas, principalmente na presença de escassez de dados de avaliação.Abstract : The most popular Recommender systems (RSs) employ Collaborative Filtering (CF) algorithms where users explicitly rate items. Based on these ratings, a user-item rating matrix is generated and used to select the items to be recommended for a target user. An important step in this process is to determine the neighborhood of a target user, i.e, a set of users who rate items similarly to this user. One of the limitations of CF is precisely the need for rating data provided voluntarily by users. The lack of interest of users to provide this kind of information increases the data sparsity problem of the ratings matrix. In this work, we propose the use of implicit feedback for neighbors selection to alleviate the sparsity problem in CF-based RSs. In this proposal, user profiles (UPs) are built based on the characteristics of items that have been accessed or purchased, and not necessarily rated by the users. This UP is used exclusively to the neighborhoods formation, which considers not how they have rated items, but by the characteristics of the items that they have accessed or purchased. Our technique was implemented with Apache Mahout Framework and evaluated across experiments in the domain of movies and books by using datasets from project GroupLens. The results demonstrated that our technique produces better quality in terms of predicting the recommendations when compared to the classic CF mainly in presence of sparsity of rating data.Willrich, RobertoUniversidade Federal de Santa CatarinaFernandes, Bruno Bandeira2020-03-31T13:24:36Z2020-03-31T13:24:36Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis118 p.| il., gráfs., tabs.application/pdf358976https://repositorio.ufsc.br/handle/123456789/204998porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-03-31T13:24:36Zoai:repositorio.ufsc.br:123456789/204998Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-03-31T13:24:36Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
title Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
spellingShingle Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
Fernandes, Bruno Bandeira
Computação
Sistemas de recomendação (filtragem de informações)
title_short Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
title_full Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
title_fullStr Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
title_full_unstemmed Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
title_sort Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
author Fernandes, Bruno Bandeira
author_facet Fernandes, Bruno Bandeira
author_role author
dc.contributor.none.fl_str_mv Willrich, Roberto
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Fernandes, Bruno Bandeira
dc.subject.por.fl_str_mv Computação
Sistemas de recomendação (filtragem de informações)
topic Computação
Sistemas de recomendação (filtragem de informações)
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
publishDate 2018
dc.date.none.fl_str_mv 2018
2020-03-31T13:24:36Z
2020-03-31T13:24:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 358976
https://repositorio.ufsc.br/handle/123456789/204998
identifier_str_mv 358976
url https://repositorio.ufsc.br/handle/123456789/204998
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 118 p.| il., gráfs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651882791436288