Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Outros Autores: | , |
Tipo de documento: | Artigo de conferência |
Idioma: | por |
Título da fonte: | Repositório Institucional da FURG (RI FURG) |
Texto Completo: | http://repositorio.furg.br/handle/1/1700 |
Resumo: | Digital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names. |
id |
FURG_9b601b4102b702dd32181bf5647d79d1 |
---|---|
oai_identifier_str |
oai:repositorio.furg.br:1/1700 |
network_acronym_str |
FURG |
network_name_str |
Repositório Institucional da FURG (RI FURG) |
repository_id_str |
|
spelling |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitaisDigital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names.Bibliotecas digitais s˜ao compostas por colec¸ ˜oes de objetos digitais, adquiridos de fontes distintas, os quais podem estar representados atrav´es de vários padr˜oes de metadados. Estes metadados s˜ao heterogˆeneos em conteúdo e estrutura. Este artigo apresenta uma abordagem para identificar metadados de objetos duplicados em bibliotecas digitais. São propostas funções de similaridade específicas para o domínio das bibliotecas digitais que comparam o conteúdo dos metadados. Os resultados dos experimentos realizados mostram que as funções propostas, quando comparadas a três abordagens distintas, melhoram a qualidade da deduplicac¸ ˜ao de metadados de 0,64 a 31,5� utilizando um algoritmo de complexidade linear para a comparac¸ ˜ao de nomes de autores.2012-01-07T22:41:04Z2012-01-07T22:41:04Z2008info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectapplication/pdfBORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011.http://repositorio.furg.br/handle/1/1700porBorges, Eduardo NunesGalante, RenataGonçalves, Marcosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FURG (RI FURG)instname:Universidade Federal do Rio Grande (FURG)instacron:FURG2014-08-22T14:36:53Zoai:repositorio.furg.br:1/1700Repositório InstitucionalPUBhttps://repositorio.furg.br/oai/request || http://200.19.254.174/oai/requestopendoar:2014-08-22T14:36:53Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)false |
dc.title.none.fl_str_mv |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
title |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
spellingShingle |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais Borges, Eduardo Nunes |
title_short |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
title_full |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
title_fullStr |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
title_full_unstemmed |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
title_sort |
Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais |
author |
Borges, Eduardo Nunes |
author_facet |
Borges, Eduardo Nunes Galante, Renata Gonçalves, Marcos |
author_role |
author |
author2 |
Galante, Renata Gonçalves, Marcos |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Borges, Eduardo Nunes Galante, Renata Gonçalves, Marcos |
description |
Digital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names. |
publishDate |
2008 |
dc.date.none.fl_str_mv |
2008 2012-01-07T22:41:04Z 2012-01-07T22:41:04Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/conferenceObject |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011. http://repositorio.furg.br/handle/1/1700 |
identifier_str_mv |
BORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011. |
url |
http://repositorio.furg.br/handle/1/1700 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da FURG (RI FURG) instname:Universidade Federal do Rio Grande (FURG) instacron:FURG |
instname_str |
Universidade Federal do Rio Grande (FURG) |
instacron_str |
FURG |
institution |
FURG |
reponame_str |
Repositório Institucional da FURG (RI FURG) |
collection |
Repositório Institucional da FURG (RI FURG) |
repository.name.fl_str_mv |
Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG) |
repository.mail.fl_str_mv |
|
_version_ |
1807384413150904320 |