Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/128639 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014. |
id |
UFSC_8dcd89993c9bbc98ec0e9d81c9caad9e |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/128639 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneasInformaticaComputaçãoBanco de dados relacionaisProcessamento eletronico de dadosEstruturas de dados (Computação)Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014.O casamento de esquemas em nível de estrutura é um processo que pode ser aplicado em diversas áreas que envolvem a manipulação de dados heterogêneos. A ideia principal é casar elementos de estruturas que podem ser encontradas em diferentes fontes de dados, como por exemplo, elementos XML, classes de objetos, tabelas relacionais, web forms entre outras. Este processo é considerado um desafio devido ao grande número de representações heterogêneas de estruturas semanticamente similares. Neste trabalho, descreve-se um método de casamento de esquemas em nível de estruturas aplicado em um processo de busca. O objetivo é utilizar não só a própria estrutura no processo de casamento, mas também dados adicionais armazenados nas fontes de dados, que podem ser suficientemente representativos para caracterizar a estrutura. Estes dados podem ser chamados de "informações contextuais" e servem como base para ajustar o escore final de similaridade entre a estrutura da consulta e as estruturas encontradas nas fontes de dados. O método proposto é composto pelos seguintes componentes: i) funções de similaridade atômicas para elementos do esquema; ii) algoritmo para detecção das informações contextuais; e iii) árvore de decisão para o ajuste final de similaridade. Foram realizados experimentos que demonstram a efetividade do método com melhoria da precisão em relação ao algoritmo usado como "baseline".<br>Abstract : Structure-level matching is an important matching operator in variousapplications areas involving heterogeneous data. The main ideia is tomatching combinations of elements that appear together in a structure,which can be found in dierent data models such as XML elements, objectclasses, relational tables, structures of web forms, and so one. Thisis a challenge due to large number of distinct representations of structuressemantically similar. In this work, we describe a structure-levelmatching method developed to search for structures representations indata sources, taking into account the similarity score between structureelements and its context. The main goal is to use any internalinformation stored in the data source as context beyond the structureinformation, which can be representative enough to characterizethe structure representation itself, for adjusting the similarity scorebetween structure elements. The proposed method consists of the followingcomponents: i) atomic similarity functions to schema elements;ii) detection algorithm of contextual information; e iii) decision tree fornal similarity score adjusts. We also present experiments showing theeectiveness of our method.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaOliveira, Karine Barbosa de2015-02-05T20:11:50Z2015-02-05T20:11:50Z2014info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis66 p.| il., grafs., tabs.application/pdf328259https://repositorio.ufsc.br/xmlui/handle/123456789/128639porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2015-02-05T20:11:50Zoai:repositorio.ufsc.br:123456789/128639Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732015-02-05T20:11:50Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
title |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
spellingShingle |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas Oliveira, Karine Barbosa de Informatica Computação Banco de dados relacionais Processamento eletronico de dados Estruturas de dados (Computação) |
title_short |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
title_full |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
title_fullStr |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
title_full_unstemmed |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
title_sort |
Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas |
author |
Oliveira, Karine Barbosa de |
author_facet |
Oliveira, Karine Barbosa de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dorneles, Carina Friedrich Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Oliveira, Karine Barbosa de |
dc.subject.por.fl_str_mv |
Informatica Computação Banco de dados relacionais Processamento eletronico de dados Estruturas de dados (Computação) |
topic |
Informatica Computação Banco de dados relacionais Processamento eletronico de dados Estruturas de dados (Computação) |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014. |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 2015-02-05T20:11:50Z 2015-02-05T20:11:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
328259 https://repositorio.ufsc.br/xmlui/handle/123456789/128639 |
identifier_str_mv |
328259 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/128639 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
66 p.| il., grafs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652023111876608 |