Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas

Detalhes bibliográficos
Autor(a) principal: Oliveira, Karine Barbosa de
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/128639
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014.
id UFSC_8dcd89993c9bbc98ec0e9d81c9caad9e
oai_identifier_str oai:repositorio.ufsc.br:123456789/128639
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneasInformaticaComputaçãoBanco de dados relacionaisProcessamento eletronico de dadosEstruturas de dados (Computação)Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014.O casamento de esquemas em nível de estrutura é um processo que pode ser aplicado em diversas áreas que envolvem a manipulação de dados heterogêneos. A ideia principal é casar elementos de estruturas que podem ser encontradas em diferentes fontes de dados, como por exemplo, elementos XML, classes de objetos, tabelas relacionais, web forms entre outras. Este processo é considerado um desafio devido ao grande número de representações heterogêneas de estruturas semanticamente similares. Neste trabalho, descreve-se um método de casamento de esquemas em nível de estruturas aplicado em um processo de busca. O objetivo é utilizar não só a própria estrutura no processo de casamento, mas também dados adicionais armazenados nas fontes de dados, que podem ser suficientemente representativos para caracterizar a estrutura. Estes dados podem ser chamados de "informações contextuais" e servem como base para ajustar o escore final de similaridade entre a estrutura da consulta e as estruturas encontradas nas fontes de dados. O método proposto é composto pelos seguintes componentes: i) funções de similaridade atômicas para elementos do esquema; ii) algoritmo para detecção das informações contextuais; e iii) árvore de decisão para o ajuste final de similaridade. Foram realizados experimentos que demonstram a efetividade do método com melhoria da precisão em relação ao algoritmo usado como "baseline".<br>Abstract : Structure-level matching is an important matching operator in variousapplications areas involving heterogeneous data. The main ideia is tomatching combinations of elements that appear together in a structure,which can be found in dierent data models such as XML elements, objectclasses, relational tables, structures of web forms, and so one. Thisis a challenge due to large number of distinct representations of structuressemantically similar. In this work, we describe a structure-levelmatching method developed to search for structures representations indata sources, taking into account the similarity score between structureelements and its context. The main goal is to use any internalinformation stored in the data source as context beyond the structureinformation, which can be representative enough to characterizethe structure representation itself, for adjusting the similarity scorebetween structure elements. The proposed method consists of the followingcomponents: i) atomic similarity functions to schema elements;ii) detection algorithm of contextual information; e iii) decision tree fornal similarity score adjusts. We also present experiments showing theeectiveness of our method.Dorneles, Carina FriedrichUniversidade Federal de Santa CatarinaOliveira, Karine Barbosa de2015-02-05T20:11:50Z2015-02-05T20:11:50Z2014info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis66 p.| il., grafs., tabs.application/pdf328259https://repositorio.ufsc.br/xmlui/handle/123456789/128639porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2015-02-05T20:11:50Zoai:repositorio.ufsc.br:123456789/128639Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732015-02-05T20:11:50Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
title Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
spellingShingle Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
Oliveira, Karine Barbosa de
Informatica
Computação
Banco de dados relacionais
Processamento eletronico de dados
Estruturas de dados (Computação)
title_short Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
title_full Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
title_fullStr Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
title_full_unstemmed Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
title_sort Nazca: um método de similaridade baseado no contexto para melhoria do casamento de estruturas heterogêneas
author Oliveira, Karine Barbosa de
author_facet Oliveira, Karine Barbosa de
author_role author
dc.contributor.none.fl_str_mv Dorneles, Carina Friedrich
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Oliveira, Karine Barbosa de
dc.subject.por.fl_str_mv Informatica
Computação
Banco de dados relacionais
Processamento eletronico de dados
Estruturas de dados (Computação)
topic Informatica
Computação
Banco de dados relacionais
Processamento eletronico de dados
Estruturas de dados (Computação)
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2014.
publishDate 2014
dc.date.none.fl_str_mv 2014
2015-02-05T20:11:50Z
2015-02-05T20:11:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 328259
https://repositorio.ufsc.br/xmlui/handle/123456789/128639
identifier_str_mv 328259
url https://repositorio.ufsc.br/xmlui/handle/123456789/128639
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 66 p.| il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652023111876608