Social tag prediction: resource-centered approaches for broad folksonomie
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/13147 |
Resumo: | This work addresses the problem of how to predict tags that will be assigned by users in Social Tagging Systems. It is widely known that tag prediction functionality helps promote system usability and increase the quality of the tag vocabulary in use. With that in mind, we verify the difference in performance of several label ranking techniques on two datasets, which differ from each other in several key metrics such as the average number of tags per resource, tag vocabulary length, total number of resources, etc. We also analyze a specific label ranking technique, namely MIMLSVM. We verify whether it generalizes to dense text representations in addition to traditional sparse ones. Experiments are conducted on the two datasets and results are analyzed. |
id |
UFRJ_246bdabbcbf45b4a44108d2acfdd612d |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/13147 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Social tag prediction: resource-centered approaches for broad folksonomiePredição de rótulos sociais: abordagens baseadas em recursos para folksonomias largasSocial tagging systemsMulti-label classificationMulti-label rankingTag predictionTag recommendationText classificationCNPQ::ENGENHARIASThis work addresses the problem of how to predict tags that will be assigned by users in Social Tagging Systems. It is widely known that tag prediction functionality helps promote system usability and increase the quality of the tag vocabulary in use. With that in mind, we verify the difference in performance of several label ranking techniques on two datasets, which differ from each other in several key metrics such as the average number of tags per resource, tag vocabulary length, total number of resources, etc. We also analyze a specific label ranking technique, namely MIMLSVM. We verify whether it generalizes to dense text representations in addition to traditional sparse ones. Experiments are conducted on the two datasets and results are analyzed.Este trabalho aborda o problema de predição de tags (rótulos) em sistemas de tagueamento colaborativo (Social Tagging Systems). É sabido que mecanismos de predição de tags em tais sistemas melhora a usabilidade dos mesmos aumenta a qualidade do vocabulário de tags. Com isso em mente, verificamos a diferença no desempenho de métodos de predição de tags quando aplicados a dois datasets que se diferenciam quanto a número de tags por recurso, quantidade total de tags, quantidade total de recursos, etc. Também analisamos um método específico para predição de tags baseado na quebra de documentos em segmentos. Verificamos se o mesmo generaliza para representações densas de textos. Experimentos são realizados nestes dois conjuntos de dados e os resultados obtidos são relatados.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJXexéo, Geraldo Bonorinohttp://lattes.cnpq.br/4783565791787812http://lattes.cnpq.br/2461238754602336Souza, Jano Moreira deOliveira, Daniel Cardoso Moraes deAlmeida, Felipe de Queiroz Badejo2020-10-02T22:55:14Z2023-12-21T03:02:20Z2018-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13147enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:20Zoai:pantheon.ufrj.br:11422/13147Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:20Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Social tag prediction: resource-centered approaches for broad folksonomie Predição de rótulos sociais: abordagens baseadas em recursos para folksonomias largas |
title |
Social tag prediction: resource-centered approaches for broad folksonomie |
spellingShingle |
Social tag prediction: resource-centered approaches for broad folksonomie Almeida, Felipe de Queiroz Badejo Social tagging systems Multi-label classification Multi-label ranking Tag prediction Tag recommendation Text classification CNPQ::ENGENHARIAS |
title_short |
Social tag prediction: resource-centered approaches for broad folksonomie |
title_full |
Social tag prediction: resource-centered approaches for broad folksonomie |
title_fullStr |
Social tag prediction: resource-centered approaches for broad folksonomie |
title_full_unstemmed |
Social tag prediction: resource-centered approaches for broad folksonomie |
title_sort |
Social tag prediction: resource-centered approaches for broad folksonomie |
author |
Almeida, Felipe de Queiroz Badejo |
author_facet |
Almeida, Felipe de Queiroz Badejo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Xexéo, Geraldo Bonorino http://lattes.cnpq.br/4783565791787812 http://lattes.cnpq.br/2461238754602336 Souza, Jano Moreira de Oliveira, Daniel Cardoso Moraes de |
dc.contributor.author.fl_str_mv |
Almeida, Felipe de Queiroz Badejo |
dc.subject.por.fl_str_mv |
Social tagging systems Multi-label classification Multi-label ranking Tag prediction Tag recommendation Text classification CNPQ::ENGENHARIAS |
topic |
Social tagging systems Multi-label classification Multi-label ranking Tag prediction Tag recommendation Text classification CNPQ::ENGENHARIAS |
description |
This work addresses the problem of how to predict tags that will be assigned by users in Social Tagging Systems. It is widely known that tag prediction functionality helps promote system usability and increase the quality of the tag vocabulary in use. With that in mind, we verify the difference in performance of several label ranking techniques on two datasets, which differ from each other in several key metrics such as the average number of tags per resource, tag vocabulary length, total number of resources, etc. We also analyze a specific label ranking technique, namely MIMLSVM. We verify whether it generalizes to dense text representations in addition to traditional sparse ones. Experiments are conducted on the two datasets and results are analyzed. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-09 2020-10-02T22:55:14Z 2023-12-21T03:02:20Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/13147 |
url |
http://hdl.handle.net/11422/13147 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815456010494541824 |