Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/204998 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018. |
id |
UFSC_3806f7d862c30d99891017dc338cfafc |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/204998 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativaComputaçãoSistemas de recomendação (filtragem de informações)Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.Os sistemas de recomendação (SRs) mais populares empregam algoritmos de Filtragem Colaborativa (FC) requerendo que usuários avaliem explicitamente os itens acessados por eles. Baseado nessas avaliações, uma matriz de avaliação Usuário-Item é gerada e usada para selecionar os itens a serem recomendados para um usuário-alvo. Uma etapa importante neste processo é determinar a vizinhança de um usuário-alvo, ou seja, um conjunto de usuários que classificaram os itens de forma similar ao usuário-alvo. Uma das limitações da FC é justamente a exigência de dados de avaliação fornecidos voluntariamente pelos usuários. Em muitos cenários, a falta de interesse dos usuários em fornecer esse tipo de dado aumenta o problema de esparsidade de dados na matriz de avaliação Usuário-Item. Este trabalho propõe o uso de realimentação implícita para a seleção de vizinhos próximos, para reduzir o problema de esparsidade em RSs baseados em FC. Nesta proposta, os Perfis de Usuários (PUs) são criados com base nas características dos itens acessados ou comprados pelos usuários e não necessariamente avaliados por esses usuários. Estes PUs são usados exclusivamente para a seleção de vizinhança, que, ao invés de considerar as avaliações dos itens, leva em consideração as características dos itens que os usuários acessaram ou compraram. A técnica foi implementada com o Framework Apache Mahout e avaliada nos domínios de filmes e livros. Para isto, foram usados os conjuntos de dados do projeto GroupLens. Os resultados demonstraram que a técnica proposta produz recomendações de melhor qualidade em termos de predição das recomendações quando comparadas às FC clássicas, principalmente na presença de escassez de dados de avaliação.Abstract : The most popular Recommender systems (RSs) employ Collaborative Filtering (CF) algorithms where users explicitly rate items. Based on these ratings, a user-item rating matrix is generated and used to select the items to be recommended for a target user. An important step in this process is to determine the neighborhood of a target user, i.e, a set of users who rate items similarly to this user. One of the limitations of CF is precisely the need for rating data provided voluntarily by users. The lack of interest of users to provide this kind of information increases the data sparsity problem of the ratings matrix. In this work, we propose the use of implicit feedback for neighbors selection to alleviate the sparsity problem in CF-based RSs. In this proposal, user profiles (UPs) are built based on the characteristics of items that have been accessed or purchased, and not necessarily rated by the users. This UP is used exclusively to the neighborhoods formation, which considers not how they have rated items, but by the characteristics of the items that they have accessed or purchased. Our technique was implemented with Apache Mahout Framework and evaluated across experiments in the domain of movies and books by using datasets from project GroupLens. The results demonstrated that our technique produces better quality in terms of predicting the recommendations when compared to the classic CF mainly in presence of sparsity of rating data.Willrich, RobertoUniversidade Federal de Santa CatarinaFernandes, Bruno Bandeira2020-03-31T13:24:36Z2020-03-31T13:24:36Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis118 p.| il., gráfs., tabs.application/pdf358976https://repositorio.ufsc.br/handle/123456789/204998porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-03-31T13:24:36Zoai:repositorio.ufsc.br:123456789/204998Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-03-31T13:24:36Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
title |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
spellingShingle |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa Fernandes, Bruno Bandeira Computação Sistemas de recomendação (filtragem de informações) |
title_short |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
title_full |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
title_fullStr |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
title_full_unstemmed |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
title_sort |
Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa |
author |
Fernandes, Bruno Bandeira |
author_facet |
Fernandes, Bruno Bandeira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Willrich, Roberto Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Fernandes, Bruno Bandeira |
dc.subject.por.fl_str_mv |
Computação Sistemas de recomendação (filtragem de informações) |
topic |
Computação Sistemas de recomendação (filtragem de informações) |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 2020-03-31T13:24:36Z 2020-03-31T13:24:36Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
358976 https://repositorio.ufsc.br/handle/123456789/204998 |
identifier_str_mv |
358976 |
url |
https://repositorio.ufsc.br/handle/123456789/204998 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
118 p.| il., gráfs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651882791436288 |