Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento

Mine, Marcelo Miky

Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento

Detalhes bibliográficos
Autor(a) principal:	Mine, Marcelo Miky
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-112356/
Resumo:	A crescente oferta de produtos, serviços e informações na Web tem levado diversas aplicações a utilizar e desenvolver sistemas de recomendação para sugerir conteúdos de acordo com as preferências de cada usuário específico. Nesses sistemas, uma grande quantidade de dados rotulados deve estar disponível para obter boas previsões. No entanto, os dados rotulados são frequentemente limitados e caros de se obter, uma vez que a rotulagem geralmente requer tempo e conhecimento humano. Além disso, geralmente, os usuários estão interessados apenas nas recomendações com melhores posições, enquanto as sugestões com posições inferiores são ignoradas. Como faltam métodos que promovam o enriquecimento (rotulagem) com classificação, este trabalho propõe uma técnica que recomenda os top-n itens com base em dados enriquecidos. O enriquecimento é baseado em um método de co-treinamento, cuja aprendizagem usa múltiplas visualizações - dados divididos em dois subconjuntos separados - para diminuir a esparsidade dos dados. A escolha dos itens no enriquecimento é baseada em uma métrica de confiança, que busca itens mais relevantes para usuário. Então, esses dois subconjuntos enriquecidos são combinados com um método de ensemble. Na avaliação, utilizamos conjuntos de dados reais de domínios distintos e os experimentos mostram que o método proposto atinge melhores resultados, em comparação com o baseline, quando um algoritmo de recomendação é usado nestes dados enriquecidos combinados.

Metadados do item

id	USP_8170d660e686aaff2a6d728b4031d1b4
oai_identifier_str	oai:teses.usp.br:tde-23062021-112356
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-TreinamentoPersonalized Ranking Based On Enriched Data: A Co-Training ApproachAprendizado semissupervisionadoCo- treinamentoCo-trainingEsparsidadeRankingRanqueamentoRecommender systemsSemi-supervised learningSistemas de recomendaçãoSparsityA crescente oferta de produtos, serviços e informações na Web tem levado diversas aplicações a utilizar e desenvolver sistemas de recomendação para sugerir conteúdos de acordo com as preferências de cada usuário específico. Nesses sistemas, uma grande quantidade de dados rotulados deve estar disponível para obter boas previsões. No entanto, os dados rotulados são frequentemente limitados e caros de se obter, uma vez que a rotulagem geralmente requer tempo e conhecimento humano. Além disso, geralmente, os usuários estão interessados apenas nas recomendações com melhores posições, enquanto as sugestões com posições inferiores são ignoradas. Como faltam métodos que promovam o enriquecimento (rotulagem) com classificação, este trabalho propõe uma técnica que recomenda os top-n itens com base em dados enriquecidos. O enriquecimento é baseado em um método de co-treinamento, cuja aprendizagem usa múltiplas visualizações - dados divididos em dois subconjuntos separados - para diminuir a esparsidade dos dados. A escolha dos itens no enriquecimento é baseada em uma métrica de confiança, que busca itens mais relevantes para usuário. Então, esses dois subconjuntos enriquecidos são combinados com um método de ensemble. Na avaliação, utilizamos conjuntos de dados reais de domínios distintos e os experimentos mostram que o método proposto atinge melhores resultados, em comparação com o baseline, quando um algoritmo de recomendação é usado nestes dados enriquecidos combinados.The growing supply of products, services and information on Web has led several applications to use and develop recommendation systems to suggest content according to each specific users preference. In these systems, a large amount of labeled data must be available to obtain good predictions. However, labeled data are often limited and expensive to obtain, since labelling usually requires time and human knowledge. Besides, usually, users are only interested in the best ranked recommendations, while lower-ranked suggestions are ignored. Since there is a lack of methods that promote enrichment (labelling) with ranking, this work proposes a technique that recommends top-n items based on enriched data. The enrichment is based on a co-training method, whose learning uses multiple views, data divided into two disjoint subsets, to decrease the data sparsity. The choice of items to enrich is based on a confidence metric, which seeks items that are more relevant to the user. Then, these two enriched subsets are combined with an ensemble method. In our evaluation, we used real data sets from distinct domains and experiments show that the proposed method achieves better results, compared to baseline, when a recommender algorithm is used in this enriched ensemble set.Biblioteca Digitais de Teses e Dissertações da USPManzato, Marcelo GarciaMine, Marcelo Miky2021-05-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-112356/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-06-24T17:46:02Zoai:teses.usp.br:tde-23062021-112356Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212021-06-24T17:46:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento Personalized Ranking Based On Enriched Data: A Co-Training Approach
title	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
spellingShingle	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento Mine, Marcelo Miky Aprendizado semissupervisionado Co- treinamento Co-training Esparsidade Ranking Ranqueamento Recommender systems Semi-supervised learning Sistemas de recomendação Sparsity
title_short	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
title_full	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
title_fullStr	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
title_full_unstemmed	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
title_sort	Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento
author	Mine, Marcelo Miky
author_facet	Mine, Marcelo Miky
author_role	author
dc.contributor.none.fl_str_mv	Manzato, Marcelo Garcia
dc.contributor.author.fl_str_mv	Mine, Marcelo Miky
dc.subject.por.fl_str_mv	Aprendizado semissupervisionado Co- treinamento Co-training Esparsidade Ranking Ranqueamento Recommender systems Semi-supervised learning Sistemas de recomendação Sparsity
topic	Aprendizado semissupervisionado Co- treinamento Co-training Esparsidade Ranking Ranqueamento Recommender systems Semi-supervised learning Sistemas de recomendação Sparsity
description	A crescente oferta de produtos, serviços e informações na Web tem levado diversas aplicações a utilizar e desenvolver sistemas de recomendação para sugerir conteúdos de acordo com as preferências de cada usuário específico. Nesses sistemas, uma grande quantidade de dados rotulados deve estar disponível para obter boas previsões. No entanto, os dados rotulados são frequentemente limitados e caros de se obter, uma vez que a rotulagem geralmente requer tempo e conhecimento humano. Além disso, geralmente, os usuários estão interessados apenas nas recomendações com melhores posições, enquanto as sugestões com posições inferiores são ignoradas. Como faltam métodos que promovam o enriquecimento (rotulagem) com classificação, este trabalho propõe uma técnica que recomenda os top-n itens com base em dados enriquecidos. O enriquecimento é baseado em um método de co-treinamento, cuja aprendizagem usa múltiplas visualizações - dados divididos em dois subconjuntos separados - para diminuir a esparsidade dos dados. A escolha dos itens no enriquecimento é baseada em uma métrica de confiança, que busca itens mais relevantes para usuário. Então, esses dois subconjuntos enriquecidos são combinados com um método de ensemble. Na avaliação, utilizamos conjuntos de dados reais de domínios distintos e os experimentos mostram que o método proposto atinge melhores resultados, em comparação com o baseline, quando um algoritmo de recomendação é usado nestes dados enriquecidos combinados.
publishDate	2021
dc.date.none.fl_str_mv	2021-05-05
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-112356/
url	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-112356/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1809091017001926656

Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento

Registros relacionados