Um método para a construção de taxonomias utilizando a DBpedia

Detalhes bibliográficos
Autor(a) principal: Andriani, Mateus Lohn
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/178331
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2017.
id UFSC_89fcde3616414a60c70c1b2dd55f4f25
oai_identifier_str oai:repositorio.ufsc.br:123456789/178331
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Um método para a construção de taxonomias utilizando a DBpediaEngenharia e gestão do conhecimentoSistemas de recuperação da informaçãoTaxinomiaDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2017.O processo de criação de taxonomias demanda esforço de especialistas de domínio, engenheiros de taxonomias, investimento financeiro e tempo. Devido às limitações existentes em fornecer estes recursos em sua integralidade em diversas organizações, muitos projetos que envolvem a construção de taxonomias não atingem o êxito esperado. Este trabalho pretende auxiliar na construção de taxonomias através da proposição de um método automatizado para a sua construção. Para a construção deste método, foi adotada uma série de procedimentos metodológicos, que se iniciou com o levantamento do referencial teórico sobre taxonomias e sua construção. Em sequência, foi realizada uma busca sistemática no domínio de construção automatizada de taxonomias, buscando encontrar abordagens e procedimentos já existentes neste campo de estudo. A partir desta revisão, foi elaborado um método para a geração de taxonomias a partir de repositórios de informações textuais com o apoio de bases de conhecimento, que fornecem as relações hierárquicas para verificação das relações taxonômicas entre os termos. Uma implementação deste método em formato de software foi realizada, utilizando uma amostra de currículos da área de conhecimento das Ciências Agrárias cadastrados na Plataforma Lattes como repositório de informações. A versão em português da DBpedia foi adotada como base de conhecimento neste experimento. Esta implementação também adota um processo de reconhecimento de entidades para a descoberta dos termos relevantes que podem ser cadastrados nas taxonomias. As propostas de taxonomias geradas pela implementação foram comparadas estatisticamente com o tesauro AGROVOC, referência na área da agricultura. Com a análise, verificou-se que 60% a 80% dos termos encontrados nas taxonomias geradas pela implementação também estão presentes no AGROVOC, sendo esta oscilação pertinente aos parâmetros de filtragem informados na entrada do método, o repositório de informações textuais utilizado e a base de conhecimento empregada para validação das relações hierárquicas.<br>Abstract : The process of creating taxonomies demands effort from domain experts, taxonomy engineers, financial investment and time. Due to the limitations of providing these resources in their entirety in several organizations, many projects that involve the construction of taxonomies do not achieve the expected success. This work intends to assist in the construction of taxonomies through the proposition of an automated method for its construction. For the construction of this method, a series of methodological procedures was adopted, which began with the survey of the theoretical reference on taxonomies and their construction. In sequence, a systematic search was made in the field of automated taxonomy construction, seeking to find approaches and procedures that already exist in this field of study. From this review, a method was developed for the generation of taxonomies from textual information repositories with the support of knowledge bases, which provide the hierarchical relationships for the verification of the taxonomic relations between the terms. An implementation of this method in software format was performed, using a sample of curricula from the Agrarian Sciences knowledge area registered in the Plataforma Lattes as a repository of information. The DBpedia?s Portuguese language version was adopted as knowledge base in this experiment. This implementation also adopts a process of entity recognition for the discovery of the relevant terms that can be registered in the taxonomies. The taxonomy proposals generated by the implementation were compared statistically with the AGROVOC thesaurus, reference in the area of agriculture. With the analysis, it was verified that 60% to 80% of the terms found in the taxonomies generated by the implementation are also present in AGROVOC, being this oscillation pertinent to the filter parameters informed in the method entry, the textual information repository used and the knowledge base used to validate hierarchical relationships.Todesco, José LeomarPacheco, Roberto Carlos dos SantosUniversidade Federal de Santa CatarinaAndriani, Mateus Lohn2017-08-15T04:13:06Z2017-08-15T04:13:06Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis149 p.| il., gráfs.application/pdf347162https://repositorio.ufsc.br/xmlui/handle/123456789/178331porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-08-15T04:13:06Zoai:repositorio.ufsc.br:123456789/178331Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-08-15T04:13:06Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Um método para a construção de taxonomias utilizando a DBpedia
title Um método para a construção de taxonomias utilizando a DBpedia
spellingShingle Um método para a construção de taxonomias utilizando a DBpedia
Andriani, Mateus Lohn
Engenharia e gestão do conhecimento
Sistemas de recuperação da informação
Taxinomia
title_short Um método para a construção de taxonomias utilizando a DBpedia
title_full Um método para a construção de taxonomias utilizando a DBpedia
title_fullStr Um método para a construção de taxonomias utilizando a DBpedia
title_full_unstemmed Um método para a construção de taxonomias utilizando a DBpedia
title_sort Um método para a construção de taxonomias utilizando a DBpedia
author Andriani, Mateus Lohn
author_facet Andriani, Mateus Lohn
author_role author
dc.contributor.none.fl_str_mv Todesco, José Leomar
Pacheco, Roberto Carlos dos Santos
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Andriani, Mateus Lohn
dc.subject.por.fl_str_mv Engenharia e gestão do conhecimento
Sistemas de recuperação da informação
Taxinomia
topic Engenharia e gestão do conhecimento
Sistemas de recuperação da informação
Taxinomia
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2017.
publishDate 2017
dc.date.none.fl_str_mv 2017-08-15T04:13:06Z
2017-08-15T04:13:06Z
2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 347162
https://repositorio.ufsc.br/xmlui/handle/123456789/178331
identifier_str_mv 347162
url https://repositorio.ufsc.br/xmlui/handle/123456789/178331
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 149 p.| il., gráfs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652250293207040