AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA

Detalhes bibliográficos
Autor(a) principal: BERNARDO PEREIRA NUNES
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
Resumo: O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.
id PUC_RIO-1_ed79cf7e6599d2b3d0c0c4ef50dabf6f
oai_identifier_str oai:MAXWELL.puc-rio.br:14382
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS 2009-04-03MARCO ANTONIO CASANOVA29997810759lattes.cnpq.br/0400232298849115MARCO ANTONIO CASANOVA29997810759lattes.cnpq.br/0400232298849115MARCO ANTONIO CASANOVAMARCO ANTONIO CASANOVAKARIN KOOGAN BREITMANANTONIO LUZ FURTADOKARIN KOOGAN BREITMAN09298820755lattes.cnpq.br/1728746187630338 BERNARDO PEREIRA NUNESPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM INFORMÁTICAPUC-RioBRO problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:05:55Zoai:MAXWELL.puc-rio.br:14382Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342018-10-25T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.en.fl_str_mv AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
dc.title.alternative.pt.fl_str_mv CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS
title AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
spellingShingle AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
BERNARDO PEREIRA NUNES
title_short AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_full AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_fullStr AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_full_unstemmed AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
title_sort AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
author BERNARDO PEREIRA NUNES
author_facet BERNARDO PEREIRA NUNES
author_role author
dc.contributor.advisor2ID.none.fl_str_mv 29997810759
dc.contributor.advisor1.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.advisor1ID.fl_str_mv 29997810759
dc.contributor.advisor1Lattes.fl_str_mv lattes.cnpq.br/0400232298849115
dc.contributor.advisor2.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.advisor2Lattes.fl_str_mv lattes.cnpq.br/0400232298849115
dc.contributor.referee1.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.referee2.fl_str_mv MARCO ANTONIO CASANOVA
dc.contributor.referee3.fl_str_mv KARIN KOOGAN BREITMAN
dc.contributor.referee4.fl_str_mv ANTONIO LUZ FURTADO
dc.contributor.referee5.fl_str_mv KARIN KOOGAN BREITMAN
dc.contributor.authorID.fl_str_mv 09298820755
dc.contributor.authorLattes.fl_str_mv lattes.cnpq.br/1728746187630338
dc.contributor.author.fl_str_mv BERNARDO PEREIRA NUNES
contributor_str_mv MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
MARCO ANTONIO CASANOVA
KARIN KOOGAN BREITMAN
ANTONIO LUZ FURTADO
KARIN KOOGAN BREITMAN
description O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui.
publishDate 2009
dc.date.issued.fl_str_mv 2009-04-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=14382@2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.publisher.program.fl_str_mv PPG EM INFORMÁTICA
dc.publisher.initials.fl_str_mv PUC-Rio
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1748324903344406528