Recomendação associativa de tags na ausência de informação prévia

Detalhes bibliográficos
Autor(a) principal: Eder Ferreira Martins
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-97HFUV
Resumo: A literatura contém uma grande variedade de estratégias de recomendação de tags, sendo que as que exploram padrões de coocorrência com tags previamente associadas aos objetos do sistema (incluindo tags disponíveis no próprio objeto alvo da recomendação), chamados de métodos associativos, têm produzido consistentemente resultados estado da arte. Entretanto, tags estão ausentes em uma parcela signicativa dos objetos de várias aplicações populares da Web 2.0, o que levanta uma preocupação a respeito da ecácia de métodos associativos frente a sua ausência. Esse é um problema bem conhecido em sistemas de recomendação, chamado cold start, e é o foco desta dissertação. Mais especicamente, aborda-se o problema de recomendar tags para objetos sem tags previamente associadas. Tal estudo é iniciado pela avaliação do impacto do cold start sobre uma família de métodos associativos, usando para isso bases de dados coletadas de várias aplicações populares da Web 2.0. Os resultados indicam que a ecácia de tais métodos é muito prejudicada quando eles não podem utilizar tags previamente associadas ao objeto alvo da recomendação. É mostrado também que o uso de estratégias automáticas de ltragem de termos para gerar um conjunto inicial de tags, a partir do qual padrões de coocorrência podem ser obtidos, produz ganhos limitados. É proposto um novo método de recomendação, mais robusto em presença do cold start, que explora tanto o feedback positivo quanto o negativo, provido pelo usuário, para iterativamente selecionar tags para os métodos associativos. Os resultados, comparando-se algumas variações da estratégia proposta, baseada em relevance feedback, com os métodos originais baseados em coocorrência, mostram que estender os métodos associativos para incluir o relevance feedback gera ganhos signicativos sobre o melhor método de referência considerado. É mostrado também que a estratégia proposta é ecaz mesmo na ausência de cooperação e de conabilidade por parte do usuário, permanecendo tão boa, se não superior, ao melhor método de referência, mesmo que o feedback provido pelo usuário contenha ruído ou que ele selecione apenas uma parte das tags relevantes que são mostradas no processo de relevance feedback.
id UFMG_7c4fa13e3ba640857fc417267d356279
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-97HFUV
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Jussara Marques de AlmeidaMarcos Andre GoncalvesNivio ZivianiPavel Pereira CaladoRicardo da Silva TorresEder Ferreira Martins2019-08-14T08:13:36Z2019-08-14T08:13:36Z2013-04-19http://hdl.handle.net/1843/ESBF-97HFUVA literatura contém uma grande variedade de estratégias de recomendação de tags, sendo que as que exploram padrões de coocorrência com tags previamente associadas aos objetos do sistema (incluindo tags disponíveis no próprio objeto alvo da recomendação), chamados de métodos associativos, têm produzido consistentemente resultados estado da arte. Entretanto, tags estão ausentes em uma parcela signicativa dos objetos de várias aplicações populares da Web 2.0, o que levanta uma preocupação a respeito da ecácia de métodos associativos frente a sua ausência. Esse é um problema bem conhecido em sistemas de recomendação, chamado cold start, e é o foco desta dissertação. Mais especicamente, aborda-se o problema de recomendar tags para objetos sem tags previamente associadas. Tal estudo é iniciado pela avaliação do impacto do cold start sobre uma família de métodos associativos, usando para isso bases de dados coletadas de várias aplicações populares da Web 2.0. Os resultados indicam que a ecácia de tais métodos é muito prejudicada quando eles não podem utilizar tags previamente associadas ao objeto alvo da recomendação. É mostrado também que o uso de estratégias automáticas de ltragem de termos para gerar um conjunto inicial de tags, a partir do qual padrões de coocorrência podem ser obtidos, produz ganhos limitados. É proposto um novo método de recomendação, mais robusto em presença do cold start, que explora tanto o feedback positivo quanto o negativo, provido pelo usuário, para iterativamente selecionar tags para os métodos associativos. Os resultados, comparando-se algumas variações da estratégia proposta, baseada em relevance feedback, com os métodos originais baseados em coocorrência, mostram que estender os métodos associativos para incluir o relevance feedback gera ganhos signicativos sobre o melhor método de referência considerado. É mostrado também que a estratégia proposta é ecaz mesmo na ausência de cooperação e de conabilidade por parte do usuário, permanecendo tão boa, se não superior, ao melhor método de referência, mesmo que o feedback provido pelo usuário contenha ruído ou que ele selecione apenas uma parte das tags relevantes que são mostradas no processo de relevance feedback.Among the existing tag recommendation strategies, those that have consistently produced state-of-the-art performance often exploit term co-occurrence patterns with tags previously assigned to the target object, possibly jointly with other textual features. However, these techniques have been evaluated only for objects with previously assigned tags. Instead, we here focus on the recommendation of tags for objects with empty tags, a variation of a well known problem called cold start. We start by evaluating state-of-the-art co-occurrence based methods in face of cold start, using datasets collected from for popular Web 2.0 applications. Our results indicate that the effectiveness of these methods suffer greatly when they cannot rely on previously assigned tags in the target object. Moreover, we show that employing various automatic filtering strategies to generate a initial set of tags that enables the use of co-ocurrence patterns produces limited gains. We then propose a new approach that exploits both positive and negative relevance feedback (RF) from the users to iteratively select input tags to these methods. Our experimental results, comparing several variations of the proposed RF strategy against the original co-occurrence based methods and other state-of-the-art baselines in various scenarios, indicate that extending the methods to include relevance feedback from users leads to significant gains in precision over the best considered baseline in cold start scenarios, and also on objects that contain some initial tags (i.e., no cold start). We also show that our best RF-driven strategy is robust to the lack of user reliability and cooperation, remaining at least as good if not superior to the best baseline even if the feedback provided by user contains noise or if users select only a portion of the relevant tags that are shown to them in the feedback process.Universidade Federal de Minas GeraisUFMGRecuperação da InformaçãoFerramentas de busca na WebSistemas de recomendaçãoComputaçãoAusência de Informação PréviaRelevance FeedbackRecomendação de tagsRecomendação associativa de tags na ausência de informação préviainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALederferreiramartins.pdfapplication/pdf2470625https://repositorio.ufmg.br/bitstream/1843/ESBF-97HFUV/1/ederferreiramartins.pdfa9b5ffc674c8d1e1781ddaea1e48bdddMD51TEXTederferreiramartins.pdf.txtederferreiramartins.pdf.txtExtracted texttext/plain194707https://repositorio.ufmg.br/bitstream/1843/ESBF-97HFUV/2/ederferreiramartins.pdf.txt88bfd176aca653b0f7c814ddedd591b6MD521843/ESBF-97HFUV2019-11-14 15:30:53.125oai:repositorio.ufmg.br:1843/ESBF-97HFUVRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T18:30:53Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Recomendação associativa de tags na ausência de informação prévia
title Recomendação associativa de tags na ausência de informação prévia
spellingShingle Recomendação associativa de tags na ausência de informação prévia
Eder Ferreira Martins
Ausência de Informação Prévia
Relevance Feedback
Recomendação de tags
Recuperação da Informação
Ferramentas de busca na Web
Sistemas de recomendação
Computação
title_short Recomendação associativa de tags na ausência de informação prévia
title_full Recomendação associativa de tags na ausência de informação prévia
title_fullStr Recomendação associativa de tags na ausência de informação prévia
title_full_unstemmed Recomendação associativa de tags na ausência de informação prévia
title_sort Recomendação associativa de tags na ausência de informação prévia
author Eder Ferreira Martins
author_facet Eder Ferreira Martins
author_role author
dc.contributor.advisor1.fl_str_mv Jussara Marques de Almeida
dc.contributor.advisor-co1.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee1.fl_str_mv Nivio Ziviani
dc.contributor.referee2.fl_str_mv Pavel Pereira Calado
dc.contributor.referee3.fl_str_mv Ricardo da Silva Torres
dc.contributor.author.fl_str_mv Eder Ferreira Martins
contributor_str_mv Jussara Marques de Almeida
Marcos Andre Goncalves
Nivio Ziviani
Pavel Pereira Calado
Ricardo da Silva Torres
dc.subject.por.fl_str_mv Ausência de Informação Prévia
Relevance Feedback
Recomendação de tags
topic Ausência de Informação Prévia
Relevance Feedback
Recomendação de tags
Recuperação da Informação
Ferramentas de busca na Web
Sistemas de recomendação
Computação
dc.subject.other.pt_BR.fl_str_mv Recuperação da Informação
Ferramentas de busca na Web
Sistemas de recomendação
Computação
description A literatura contém uma grande variedade de estratégias de recomendação de tags, sendo que as que exploram padrões de coocorrência com tags previamente associadas aos objetos do sistema (incluindo tags disponíveis no próprio objeto alvo da recomendação), chamados de métodos associativos, têm produzido consistentemente resultados estado da arte. Entretanto, tags estão ausentes em uma parcela signicativa dos objetos de várias aplicações populares da Web 2.0, o que levanta uma preocupação a respeito da ecácia de métodos associativos frente a sua ausência. Esse é um problema bem conhecido em sistemas de recomendação, chamado cold start, e é o foco desta dissertação. Mais especicamente, aborda-se o problema de recomendar tags para objetos sem tags previamente associadas. Tal estudo é iniciado pela avaliação do impacto do cold start sobre uma família de métodos associativos, usando para isso bases de dados coletadas de várias aplicações populares da Web 2.0. Os resultados indicam que a ecácia de tais métodos é muito prejudicada quando eles não podem utilizar tags previamente associadas ao objeto alvo da recomendação. É mostrado também que o uso de estratégias automáticas de ltragem de termos para gerar um conjunto inicial de tags, a partir do qual padrões de coocorrência podem ser obtidos, produz ganhos limitados. É proposto um novo método de recomendação, mais robusto em presença do cold start, que explora tanto o feedback positivo quanto o negativo, provido pelo usuário, para iterativamente selecionar tags para os métodos associativos. Os resultados, comparando-se algumas variações da estratégia proposta, baseada em relevance feedback, com os métodos originais baseados em coocorrência, mostram que estender os métodos associativos para incluir o relevance feedback gera ganhos signicativos sobre o melhor método de referência considerado. É mostrado também que a estratégia proposta é ecaz mesmo na ausência de cooperação e de conabilidade por parte do usuário, permanecendo tão boa, se não superior, ao melhor método de referência, mesmo que o feedback provido pelo usuário contenha ruído ou que ele selecione apenas uma parte das tags relevantes que são mostradas no processo de relevance feedback.
publishDate 2013
dc.date.issued.fl_str_mv 2013-04-19
dc.date.accessioned.fl_str_mv 2019-08-14T08:13:36Z
dc.date.available.fl_str_mv 2019-08-14T08:13:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-97HFUV
url http://hdl.handle.net/1843/ESBF-97HFUV
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-97HFUV/1/ederferreiramartins.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-97HFUV/2/ederferreiramartins.pdf.txt
bitstream.checksum.fl_str_mv a9b5ffc674c8d1e1781ddaea1e48bddd
88bfd176aca653b0f7c814ddedd591b6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589512062828544