KDC: uma abordagem baseada em conhecimento para classificação de documentos

Detalhes bibliográficos
Autor(a) principal: Silva, Gleidson Antônio Cardoso da
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/169614
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.
id UFSC_474d593b3daf6150f47b0996b9892a6a
oai_identifier_str oai:repositorio.ufsc.br:123456789/169614
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling KDC: uma abordagem baseada em conhecimento para classificação de documentosComputaçãoDocumentosClassificaçãoRecuperação da informaçãoBanco de dados textuaisDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.Classificação de documentos fornece um meio para organizar as informações, permitindo uma melhor compreensão e interpretação dos dados. A tarefa de classificar é caracterizada pela associação de rótulos de classes a documentos com o objetivo de criar agrupamentos semânticos. O aumento exponencial no número de documentos e dados digitais demanda formas mais precisas, abrangentes e eficientes para busca e organização de informações. Nesse contexto, o aprimoramento de técnicas de classificação de documentos com o uso de informação semântica é considerado essencial. Sendo assim, este trabalho propõe uma abordagem baseada em conhecimento para a classificação de documentos. A técnica utiliza termos extraídos de documentos associando-os a conceitos de uma base de conhecimento de domínio aberto. Em seguida, os conceitos são generalizados a um nível maior de abstração. Por fim, é calculado um valor de disparidade entre os conceitos generalizados e o documento, sendo o conceito de menor disparidade considerado como rótulo de classe aplicável ao documento. A aplicação da técnica proposta oferece vantagens sobre os métodos convencionais como a ausência da necessidade de treinamento, a oportunidade de atribuir uma ou múltiplas classes a um documento e a capacidade de aplicação em diferentes temas de classificação sem a necessidade de alterar o classificador.<br>Abstract : Document classification provides a way to organize information, providing a better way to understand available data. The classification task is characterized by the association of class labels to documents, aiming to create semantic clusters. The exponential increase in the number of documents and digital data demands for more precise, comprehensive and efficient ways to search and organize information. In this context, the improvement of document classification techniques using semantic information is considered essential. Thus, this paper proposes a knowledge-based approach for the classification of documents. The technique uses terms extracted from documents in association with concepts of an open domain knowledge base. Then, the concepts are generalized to a higher level of abstraction. Finally a disparity value between generalized concepts and the document is calculated, and the best ranked concept is then considered as a class label applicable to the document. The application of the proposed technique offers advantages over conventional methods including no need for training, the choice to assign one or multiple classes to a document and the capacity to classify over different subjects without the need to change the classifier.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaSilva, Gleidson Antônio Cardoso da2016-10-19T13:16:10Z2016-10-19T13:16:10Z2015info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis58 p.| il., grafs., tabs.application/pdf338993https://repositorio.ufsc.br/xmlui/handle/123456789/169614porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2016-10-19T13:16:10Zoai:repositorio.ufsc.br:123456789/169614Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732016-10-19T13:16:10Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv KDC: uma abordagem baseada em conhecimento para classificação de documentos
title KDC: uma abordagem baseada em conhecimento para classificação de documentos
spellingShingle KDC: uma abordagem baseada em conhecimento para classificação de documentos
Silva, Gleidson Antônio Cardoso da
Computação
Documentos
Classificação
Recuperação da informação
Banco de dados textuais
title_short KDC: uma abordagem baseada em conhecimento para classificação de documentos
title_full KDC: uma abordagem baseada em conhecimento para classificação de documentos
title_fullStr KDC: uma abordagem baseada em conhecimento para classificação de documentos
title_full_unstemmed KDC: uma abordagem baseada em conhecimento para classificação de documentos
title_sort KDC: uma abordagem baseada em conhecimento para classificação de documentos
author Silva, Gleidson Antônio Cardoso da
author_facet Silva, Gleidson Antônio Cardoso da
author_role author
dc.contributor.none.fl_str_mv Dorneles, Carina Friedrich
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Silva, Gleidson Antônio Cardoso da
dc.subject.por.fl_str_mv Computação
Documentos
Classificação
Recuperação da informação
Banco de dados textuais
topic Computação
Documentos
Classificação
Recuperação da informação
Banco de dados textuais
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.
publishDate 2015
dc.date.none.fl_str_mv 2015
2016-10-19T13:16:10Z
2016-10-19T13:16:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 338993
https://repositorio.ufsc.br/xmlui/handle/123456789/169614
identifier_str_mv 338993
url https://repositorio.ufsc.br/xmlui/handle/123456789/169614
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 58 p.| il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652216779669504