[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA

Detalhes bibliográficos
Autor(a) principal: BERNARDO PEREIRA NUNES
Data de Publicação: 2009
Tipo de documento: Outros
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
http://doi.org/10.17771/PUCRio.acad.14382
Resumo: [pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.
id PUC_RIO-1_ed79cf7e6599d2b3d0c0c4ef50dabf6f
oai_identifier_str oai:MAXWELL.puc-rio.br:14382
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA [pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS [pt] CLASSIFICACAO[pt] ALGORITMO DE CLASSIFICACAO[pt] CLASSIFICACAO HIERARQUICA[en] CLASSIFICATION[pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.[en] The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.MAXWELLMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVABERNARDO PEREIRA NUNES2009-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2http://doi.org/10.17771/PUCRio.acad.14382porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2018-10-25T00:00:00Zoai:MAXWELL.puc-rio.br:14382Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-10-25T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
[pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS
title [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
spellingShingle [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
BERNARDO PEREIRA NUNES
[pt] CLASSIFICACAO
[pt] ALGORITMO DE CLASSIFICACAO
[pt] CLASSIFICACAO HIERARQUICA
[en] CLASSIFICATION
title_short [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_full [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_fullStr [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_full_unstemmed [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_sort [en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
author BERNARDO PEREIRA NUNES
author_facet BERNARDO PEREIRA NUNES
author_role author
dc.contributor.none.fl_str_mv MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
dc.contributor.author.fl_str_mv BERNARDO PEREIRA NUNES
dc.subject.por.fl_str_mv [pt] CLASSIFICACAO
[pt] ALGORITMO DE CLASSIFICACAO
[pt] CLASSIFICACAO HIERARQUICA
[en] CLASSIFICATION
topic [pt] CLASSIFICACAO
[pt] ALGORITMO DE CLASSIFICACAO
[pt] CLASSIFICACAO HIERARQUICA
[en] CLASSIFICATION
description [pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.
publishDate 2009
dc.date.none.fl_str_mv 2009-10-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/other
format other
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
http://doi.org/10.17771/PUCRio.acad.14382
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
http://doi.org/10.17771/PUCRio.acad.14382
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1814822573692682240