Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging

Detalhes bibliográficos
Autor(a) principal: Borth, Marcelo Rafael
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
Texto Completo: http://repositorio.uem.br:8080/jspui/handle/1/2567
Resumo: Due to the popularization of the Web large amounts of content became available, mainly due to the current ease of content publishing by nontechnical users. This easiness promotes an uncontrollable growth of the total available information, thus creating the need for mechanisms for indexing content to assist users when retrieving information. Because of this information overload, it is infeasible for a user to organize their information without using tools that facilitate the recovery process. One way to accomplish this organization is by a categorization system based on tagging, which helps the process of assigning meaning to any object accessible over the Web. However, since the tags used in the categorizations are freely selected by the user, without any strict control to follow, using this type of system can have various limitations, especially when users need to retrieve an object categorized. This problem gets harder as the users make use of the system, because their vocabulary can become inconsistent due to typing errors, the creation of synonyms and polysemic terms, the introduction of different lexical forms of writing for the same conceptual representation, etc., and, consequently, many relevant resources may be excluded from the search results. Therefore, in this thesis it is proposed an approach for the recommendation of semantic tags that aim to improve the quality of the categorizations made by users looking forward to facilitate the information retrieval, and also to solve the of cold-start problem. The proposal combines three different information sources to generate the recommendation: (i) the textual elements of the Web page, (ii) the folksonomy tags of the page in question, and (iii) the user personomy. Thus, the proposed approach tries to personalize the recommendations based on the user characteristics and interests, as well as to reduce the problems related to the process of tagging. The results for the acceptance of the recommended tags from the execution of some experiments with real users were favorable for the categorization task, which tends to reduce the efforts necessary in the recovery phase of the objects categorized.
id UEM-10_2c22e0e704310de6d8ed4892ff71f400
oai_identifier_str oai:localhost:1/2567
network_acronym_str UEM-10
network_name_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository_id_str
spelling Uma abordagem de recomendação de tags semânticas para sistemas baseados em taggingAn approach to semantic tag recommendation for tagging-based systems.TagsRecomendaçãoTaggingIdentificação de semânticaRecuperação da informaçãoRecurso WebOntologiaOrganização da informaçãoSistemas de informaçãoBrasil.Tag recommendationOntologyInformation retrievalTagging-Based SystemBrazil.Ciências Exatas e da TerraCiência da ComputaçãoDue to the popularization of the Web large amounts of content became available, mainly due to the current ease of content publishing by nontechnical users. This easiness promotes an uncontrollable growth of the total available information, thus creating the need for mechanisms for indexing content to assist users when retrieving information. Because of this information overload, it is infeasible for a user to organize their information without using tools that facilitate the recovery process. One way to accomplish this organization is by a categorization system based on tagging, which helps the process of assigning meaning to any object accessible over the Web. However, since the tags used in the categorizations are freely selected by the user, without any strict control to follow, using this type of system can have various limitations, especially when users need to retrieve an object categorized. This problem gets harder as the users make use of the system, because their vocabulary can become inconsistent due to typing errors, the creation of synonyms and polysemic terms, the introduction of different lexical forms of writing for the same conceptual representation, etc., and, consequently, many relevant resources may be excluded from the search results. Therefore, in this thesis it is proposed an approach for the recommendation of semantic tags that aim to improve the quality of the categorizations made by users looking forward to facilitate the information retrieval, and also to solve the of cold-start problem. The proposal combines three different information sources to generate the recommendation: (i) the textual elements of the Web page, (ii) the folksonomy tags of the page in question, and (iii) the user personomy. Thus, the proposed approach tries to personalize the recommendations based on the user characteristics and interests, as well as to reduce the problems related to the process of tagging. The results for the acceptance of the recommended tags from the execution of some experiments with real users were favorable for the categorization task, which tends to reduce the efforts necessary in the recovery phase of the objects categorized.Devido à popularização da Web grandes quantidades de conteúdos tornaram-se disponíveis, principalmente em função da atual facilidade de publicação de conteúdo por usuários leigos. Essa facilidade promove um incontrolável crescimento do total de informação acessível, criando, assim, a necessidade de mecanismos para indexação de conteúdos para auxiliar o usuário na recuperação da informação. Por causa dessa sobrecarga de informação, torna-se inviável que um usuário organize suas informações sem utilizar ferramentas que facilitem o processo de recuperação. Uma forma para efetuar essa organização é por meio de categorizações a partir de um sistema baseado em tagging, o qual auxilia o processo de atribuição de significado a qualquer objeto acessível na Web. Entretanto, uma vez que as tags utilizadas nas categorizações são selecionadas livremente pelo usuário, sem nenhum controle ou esquema rígido a ser seguido, a utilização desse tipo de sistema pode sofrer várias limitações, principalmente quando os usuários precisam recuperar um objeto categorizado. Esse problema se agrava na medida em que o usuário utiliza o sistema, pois seu vocabulário pode tornar-se inconsistente devido a erros de digitação, a criação de termos sinônimos e polissêmicos, a introdução de formas léxicas de escrita distintas para uma mesma representação conceitual, etc., e, por conseqüência, muitos recursos relevantes poderão ser excluídos dos resultados das buscas. Por essa razão, nesta dissertação é proposta uma abordagem de recomendação de tags semânticas que visa melhorar a qualidade das categorizações realizadas pelos usuários para facilitar a recuperação de informação e, também, resolver o problema de "cold-start". A proposta combina três fontes de informação distintas para gerar a recomendação: (i) os elementos textuais da página Web, (ii) as tags da folksonomia relativas à página em questão, e (iii) a personomia do usuário. Deste modo, a abordagem proposta tenta personalizar as recomendações com base nas características e interesses do usuário, bem como reduzir os problemas relacionados ao processo de tagging. Os resultados obtidos sobre a aceitação das tags recomendadas, a partir da execução de alguns experimentos com usuários reais, mostraram-se favoráveis para a tarefa de categorização, o que tende a reduzir os esforços empregados na fase de recuperação dos objetos categorizados.119 fUniversidade Estadual de MaringáBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUEMMaringá, PRDepartamento de Informáticaa: Sérgio Roberto Pereira da SilvaLuciana Andréia Fondazzi Martimiano - UEMVânia Paula de Almeida Neris - UFSCarBorth, Marcelo Rafael2018-04-10T20:12:26Z2018-04-10T20:12:26Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://repositorio.uem.br:8080/jspui/handle/1/2567porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)instname:Universidade Estadual de Maringá (UEM)instacron:UEM2018-04-10T20:12:26Zoai:localhost:1/2567Repositório InstitucionalPUBhttp://repositorio.uem.br:8080/oai/requestopendoar:2024-04-23T14:55:37.923034Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)false
dc.title.none.fl_str_mv Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
An approach to semantic tag recommendation for tagging-based systems.
title Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
spellingShingle Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
Borth, Marcelo Rafael
Tags
Recomendação
Tagging
Identificação de semântica
Recuperação da informação
Recurso Web
Ontologia
Organização da informação
Sistemas de informação
Brasil.
Tag recommendation
Ontology
Information retrieval
Tagging-Based System
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
title_short Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
title_full Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
title_fullStr Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
title_full_unstemmed Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
title_sort Uma abordagem de recomendação de tags semânticas para sistemas baseados em tagging
author Borth, Marcelo Rafael
author_facet Borth, Marcelo Rafael
author_role author
dc.contributor.none.fl_str_mv a: Sérgio Roberto Pereira da Silva
Luciana Andréia Fondazzi Martimiano - UEM
Vânia Paula de Almeida Neris - UFSCar
dc.contributor.author.fl_str_mv Borth, Marcelo Rafael
dc.subject.por.fl_str_mv Tags
Recomendação
Tagging
Identificação de semântica
Recuperação da informação
Recurso Web
Ontologia
Organização da informação
Sistemas de informação
Brasil.
Tag recommendation
Ontology
Information retrieval
Tagging-Based System
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
topic Tags
Recomendação
Tagging
Identificação de semântica
Recuperação da informação
Recurso Web
Ontologia
Organização da informação
Sistemas de informação
Brasil.
Tag recommendation
Ontology
Information retrieval
Tagging-Based System
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
description Due to the popularization of the Web large amounts of content became available, mainly due to the current ease of content publishing by nontechnical users. This easiness promotes an uncontrollable growth of the total available information, thus creating the need for mechanisms for indexing content to assist users when retrieving information. Because of this information overload, it is infeasible for a user to organize their information without using tools that facilitate the recovery process. One way to accomplish this organization is by a categorization system based on tagging, which helps the process of assigning meaning to any object accessible over the Web. However, since the tags used in the categorizations are freely selected by the user, without any strict control to follow, using this type of system can have various limitations, especially when users need to retrieve an object categorized. This problem gets harder as the users make use of the system, because their vocabulary can become inconsistent due to typing errors, the creation of synonyms and polysemic terms, the introduction of different lexical forms of writing for the same conceptual representation, etc., and, consequently, many relevant resources may be excluded from the search results. Therefore, in this thesis it is proposed an approach for the recommendation of semantic tags that aim to improve the quality of the categorizations made by users looking forward to facilitate the information retrieval, and also to solve the of cold-start problem. The proposal combines three different information sources to generate the recommendation: (i) the textual elements of the Web page, (ii) the folksonomy tags of the page in question, and (iii) the user personomy. Thus, the proposed approach tries to personalize the recommendations based on the user characteristics and interests, as well as to reduce the problems related to the process of tagging. The results for the acceptance of the recommended tags from the execution of some experiments with real users were favorable for the categorization task, which tends to reduce the efforts necessary in the recovery phase of the objects categorized.
publishDate 2011
dc.date.none.fl_str_mv 2011
2018-04-10T20:12:26Z
2018-04-10T20:12:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.uem.br:8080/jspui/handle/1/2567
url http://repositorio.uem.br:8080/jspui/handle/1/2567
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Departamento de Informática
publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Departamento de Informática
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
instname:Universidade Estadual de Maringá (UEM)
instacron:UEM
instname_str Universidade Estadual de Maringá (UEM)
instacron_str UEM
institution UEM
reponame_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
collection Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository.name.fl_str_mv Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)
repository.mail.fl_str_mv
_version_ 1813258653612900352