[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Outros |
Idioma: | por |
Título da fonte: | Repositório Institucional da PUC-RIO (Projeto Maxwell) |
Texto Completo: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2 http://doi.org/10.17771/PUCRio.acad.14382 |
Resumo: | [pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui. |
id |
PUC_RIO-1_ed79cf7e6599d2b3d0c0c4ef50dabf6f |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:14382 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
534 |
spelling |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA [pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS [pt] CLASSIFICACAO[pt] ALGORITMO DE CLASSIFICACAO[pt] CLASSIFICACAO HIERARQUICA[en] CLASSIFICATION[pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.[en] The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.MAXWELLMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVABERNARDO PEREIRA NUNES2009-10-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/otherhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2http://doi.org/10.17771/PUCRio.acad.14382porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2018-10-25T00:00:00Zoai:MAXWELL.puc-rio.br:14382Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-10-25T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
dc.title.none.fl_str_mv |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA [pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS |
title |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
spellingShingle |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA BERNARDO PEREIRA NUNES [pt] CLASSIFICACAO [pt] ALGORITMO DE CLASSIFICACAO [pt] CLASSIFICACAO HIERARQUICA [en] CLASSIFICATION |
title_short |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
title_full |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
title_fullStr |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
title_full_unstemmed |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
title_sort |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA |
author |
BERNARDO PEREIRA NUNES |
author_facet |
BERNARDO PEREIRA NUNES |
author_role |
author |
dc.contributor.none.fl_str_mv |
MARCO ANTONIO CASANOVA MARCO ANTONIO CASANOVA MARCO ANTONIO CASANOVA |
dc.contributor.author.fl_str_mv |
BERNARDO PEREIRA NUNES |
dc.subject.por.fl_str_mv |
[pt] CLASSIFICACAO [pt] ALGORITMO DE CLASSIFICACAO [pt] CLASSIFICACAO HIERARQUICA [en] CLASSIFICATION |
topic |
[pt] CLASSIFICACAO [pt] ALGORITMO DE CLASSIFICACAO [pt] CLASSIFICACAO HIERARQUICA [en] CLASSIFICATION |
description |
[pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009-10-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/other |
format |
other |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2 http://doi.org/10.17771/PUCRio.acad.14382 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2 http://doi.org/10.17771/PUCRio.acad.14382 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
MAXWELL |
publisher.none.fl_str_mv |
MAXWELL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
repository.mail.fl_str_mv |
|
_version_ |
1814822573692682240 |