Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais

Detalhes bibliográficos
Autor(a) principal: Borges, Eduardo Nunes
Data de Publicação: 2008
Outros Autores: Galante, Renata, Gonçalves, Marcos
Tipo de documento: Artigo de conferência
Idioma: por
Título da fonte: Repositório Institucional da FURG (RI FURG)
Texto Completo: http://repositorio.furg.br/handle/1/1700
Resumo: Digital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names.
id FURG_9b601b4102b702dd32181bf5647d79d1
oai_identifier_str oai:repositorio.furg.br:1/1700
network_acronym_str FURG
network_name_str Repositório Institucional da FURG (RI FURG)
repository_id_str
spelling Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitaisDigital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names.Bibliotecas digitais s˜ao compostas por colec¸ ˜oes de objetos digitais, adquiridos de fontes distintas, os quais podem estar representados atrav´es de vários padr˜oes de metadados. Estes metadados s˜ao heterogˆeneos em conteúdo e estrutura. Este artigo apresenta uma abordagem para identificar metadados de objetos duplicados em bibliotecas digitais. São propostas funções de similaridade específicas para o domínio das bibliotecas digitais que comparam o conteúdo dos metadados. Os resultados dos experimentos realizados mostram que as funções propostas, quando comparadas a três abordagens distintas, melhoram a qualidade da deduplicac¸ ˜ao de metadados de 0,64 a 31,5� utilizando um algoritmo de complexidade linear para a comparac¸ ˜ao de nomes de autores.2012-01-07T22:41:04Z2012-01-07T22:41:04Z2008info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/conferenceObjectapplication/pdfBORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011.http://repositorio.furg.br/handle/1/1700porBorges, Eduardo NunesGalante, RenataGonçalves, Marcosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FURG (RI FURG)instname:Universidade Federal do Rio Grande (FURG)instacron:FURG2014-08-22T14:36:53Zoai:repositorio.furg.br:1/1700Repositório InstitucionalPUBhttps://repositorio.furg.br/oai/request || http://200.19.254.174/oai/requestopendoar:2014-08-22T14:36:53Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)false
dc.title.none.fl_str_mv Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
title Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
spellingShingle Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
Borges, Eduardo Nunes
title_short Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
title_full Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
title_fullStr Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
title_full_unstemmed Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
title_sort Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais
author Borges, Eduardo Nunes
author_facet Borges, Eduardo Nunes
Galante, Renata
Gonçalves, Marcos
author_role author
author2 Galante, Renata
Gonçalves, Marcos
author2_role author
author
dc.contributor.author.fl_str_mv Borges, Eduardo Nunes
Galante, Renata
Gonçalves, Marcos
description Digital libraries contain collections of digital objects, acquired from different sources, which can be represented through several metadata standards. These metadata are heterogeneous both in content and in structure. This paper presents an approach that identifies duplicated metadata records referring to objects from digital libraries. We propose similarity functions designed for the digital library domain that compare the content of metadata. The results of experiments show that the proposed functions, compared to three different baselines, improve the quality of metadata deduplication from 0.64 to 31.5� using an algorithm with linear complexity to compare authors’ names.
publishDate 2008
dc.date.none.fl_str_mv 2008
2012-01-07T22:41:04Z
2012-01-07T22:41:04Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/conferenceObject
format conferenceObject
status_str publishedVersion
dc.identifier.uri.fl_str_mv BORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011.
http://repositorio.furg.br/handle/1/1700
identifier_str_mv BORGES, Eduardo; GALANTE, Renata; GONÇALVES, Marcos. Uma abordagem efetiva e eficiente para deduplicação de metadados bibliográficos de objetos digitais. In: SIMPÓSIO BRASILEIRO DE BANCOS DE DADOS, 23., 2008, Campinas. Anais eletrônicos... Campinas, 2008. Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/sbbd/2008/006.pdf>. Acesso em: 24 dez. 2011.
url http://repositorio.furg.br/handle/1/1700
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da FURG (RI FURG)
instname:Universidade Federal do Rio Grande (FURG)
instacron:FURG
instname_str Universidade Federal do Rio Grande (FURG)
instacron_str FURG
institution FURG
reponame_str Repositório Institucional da FURG (RI FURG)
collection Repositório Institucional da FURG (RI FURG)
repository.name.fl_str_mv Repositório Institucional da FURG (RI FURG) - Universidade Federal do Rio Grande (FURG)
repository.mail.fl_str_mv
_version_ 1807384413150904320