spelling |
Jussara Marques de AlmeidaMarcos Andre GoncalvesPavel Pereira CaladoAltigran Soares da SilvaNivio ZivianiFabiano Muniz Belem2019-08-10T09:31:45Z2019-08-10T09:31:45Z2011-07-06http://hdl.handle.net/1843/SLSS-8KEEQ3Diversas aplicações da Web 2.0 permitem aos usuários a livre atribuição de palavras-chave (tags) ao conteúdo, para prover uma melhor organização e descrição do mesmo. Nessas aplicações, serviços de recomendação de tags podem auxiliar o usuário nesta tarefa, melhorando a qualidade da informação disponível e, consequentemente, a eficácia de serviços de Recuperação de Informação (RI) que exploram tags, tais como busca e classificação.Esta dissertação aborda duas tarefas relacionadas à recomendação de tags. A primeira tem foco no objeto, objetivando sugerir tags que sejam relevantes a um determinado conteúdo. A segunda tarefa é personalizada, visando recomendar tags que sejam relevantes ao mesmo tempo a um objeto alvo e a um usuário alvo. Nossas estratégias de recomendação focadas no objeto exploram conjuntamente três dimensões do problema: (i) co-ocorrência de termos com tags previamente associadas ao objeto alvo; (ii) termos extraídos de múltiplos atributos textuais; e (iii) várias métricas de relevância de tags.Nossas estratégias de recomendação de tags personalizada exploram todas as dimensões mencionadas acima e o histórico de atribuições de tags do usuário alvo.Em particular, nós propusemos várias novas heurísticas, que estendem estratégias estado-da-arte, incluindo novas métricas que tentam capturar a capacidade de um termo descrever o conteúdo de um objeto. Nós também exploramos duas técnicas baseadas em learning-to-rank (L2R), a saber, RankSVM e Programação Genética (PG). Elas geram funções que combinam múltiplas métricas para estimar a relevância de uma tag a um dado objeto ou a um par objeto-usuário. Nós avaliamos os métodos propostos em vários cenários, em três aplicações populares da Web 2.0: LastFM, YouTube e YahooVideo.Os resultados de nossas heurísticas apresentam ganhos significativos em precisão e revocação quando comparados às melhores estratégias utilizadas como linhas de base.Alguns ganhos adicionais modestos podem também ser obtidos através de nossas estratégias baseadas em L2R. Apesar dos ganhos serem modestos, vale ressaltar que essas técnicas têm a vantagem de serem bem flexíveis, podendo ser facilmente estendidas para explorar outros aspectos do problema de recomendação de tags.Several Web 2.0 applications allow users to assign keywords (tags) to the content, in order to provide a better organization and description of the shared content. Tag recommendation tasks may assist users in this task, improving the quality of the available information and, thus, the effectiveness of Information Retrieval (IR) services which exploit tags, such as searching and classification. This work addresses two tag recommendation tasks. The first one aims at suggesting relevant tags to a target object. The second task is personalized, aiming at recommending tags which are simultaneously relevant to a target object and a target user.Our tag recommendation strategies focused on the object jointly exploit three dimensions of the problem: (i) term co-occurrence with tags pre-assigned to the target object, (ii) terms extracted from multiple textual features, and (iii) several metrics of tag relevance.Our personalized tag recommendation strategies exploit all dimensions mentioned above and a metric related to the history of tag assignments of the target user. In particular, we propose several new heuristic methods, which extend previous, highly effective and efficient, state-of-the-art strategies by including new metrics that try to capture how accurately a candidate term describes the objects content. We also exploit two learning to rank techniques, namely RankSVM and Genetic Programming, for the task of generating ranking functions that combine multiple metrics to accurately estimate the relevance of a tag toa given object or pair user-object. We evaluate all proposed methods in various scenarios for three popular Web 2.0 applications, namely, LastFM, YouTube and YahooVideo. We found that our heuristics greatly outperform the best baseline in each scenario and task. Some further, modest improvements can also be achieved, in some scenarios of both personalized and object-focused, with our new learning-to-rank based strategies. However, they have the additional advantage of being quite flexible and easily extensible to exploit other aspects of the tag recommendation problem.Universidade Federal de Minas GeraisUFMGRecuperação da informaçãoFerramentas de busca na WebSistemas de recomendaçãoProgramação genética (Computação)ComputaçãoPesquisa por palavras-chaveWeb 20Recomendação associativa de tags considerando múltiplos atributos textuaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALfabianobelem.pdfapplication/pdf1476026https://repositorio.ufmg.br/bitstream/1843/SLSS-8KEEQ3/1/fabianobelem.pdf63f8e6f5e75aa056a930a909484f0f44MD51TEXTfabianobelem.pdf.txtfabianobelem.pdf.txtExtracted texttext/plain365661https://repositorio.ufmg.br/bitstream/1843/SLSS-8KEEQ3/2/fabianobelem.pdf.txt1475a8db544234c69f3ed0507e3e164dMD521843/SLSS-8KEEQ32019-11-14 11:06:47.052oai:repositorio.ufmg.br:1843/SLSS-8KEEQ3Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T14:06:47Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
|