Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos

Detalhes bibliográficos
Autor(a) principal: Jean Wanderlei Alves de Oliveira
Data de Publicação: 2005
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-6EAGQK
Resumo: O problema de sobrecarga informacional gerado pelo sucesso da Web provocou o surgimento de serviços que reúnem informações em contextos específicos, conhecidos como bibliotecas digitais. Bibliotecas digitais reúnem informações digitais e metadados que freqüentemente são obtidos a partir de fontes diversas. A não padronização dos metadados oriundos dessas fontes traz como consequência a ambiguidade em determinados campos. Nesta dissertação apresentamos uma estratégia para o tratamento de ambiguidades encontradas em campos referentes a nomes de autores em bibliotecas digitais. Nossa estratégia utiliza técnicas de recuperação de informação associadas a um algoritmo de agrupamento que permite a criação de arquivos de autoridade. Demonstramos a eficácia de nossa estratégia através da realização de experimentos sobre duas coleções de teste derivadas da Biblioteca Digital Brasileira de Computação (BDBComp) e Digital Bibliography of Library Project (DBLP). Para a coleção da BDBComp, a média entre a qualidade dos grupos gerados e sua fragmentação foi superior à marca de 90%, e para a coleção da DBLP, essa média foi superior a 65%.
id UFMG_f12ca6fb80fb7d736406872728809a41
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-6EAGQK
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Alberto Henrique Frade LaenderMarcello Peixoto BaxMarcos André GonçalvesOsvaldo Sergio Farhat de CarvalhoJean Wanderlei Alves de Oliveira2019-08-11T16:54:18Z2019-08-11T16:54:18Z2005-04-01http://hdl.handle.net/1843/RVMR-6EAGQKO problema de sobrecarga informacional gerado pelo sucesso da Web provocou o surgimento de serviços que reúnem informações em contextos específicos, conhecidos como bibliotecas digitais. Bibliotecas digitais reúnem informações digitais e metadados que freqüentemente são obtidos a partir de fontes diversas. A não padronização dos metadados oriundos dessas fontes traz como consequência a ambiguidade em determinados campos. Nesta dissertação apresentamos uma estratégia para o tratamento de ambiguidades encontradas em campos referentes a nomes de autores em bibliotecas digitais. Nossa estratégia utiliza técnicas de recuperação de informação associadas a um algoritmo de agrupamento que permite a criação de arquivos de autoridade. Demonstramos a eficácia de nossa estratégia através da realização de experimentos sobre duas coleções de teste derivadas da Biblioteca Digital Brasileira de Computação (BDBComp) e Digital Bibliography of Library Project (DBLP). Para a coleção da BDBComp, a média entre a qualidade dos grupos gerados e sua fragmentação foi superior à marca de 90%, e para a coleção da DBLP, essa média foi superior a 65%.The problem of informational overload generated by the success of the Web has led to the emergence of services that congregate information in specific contexts, known as digital libraries. Digital libraries combine digital information and metadata that frequently are collected from diverse sources. The lack of standardization of metadata deriving from these sources brings as consequence the ambiguity in determined fields. In this dissertation we present a strategy for the disambiguation in fields referring to names of authors in digital libraries. Our strategy uses Information Retrieval techniques associated to a clustering algorithm that allows the creation of unified indexes. We demonstrate the effectiveness of our strategy through a set of experiments conducted on two test collections derived from the Biblioteca Digital Brasileira de Computação (BDBComp) and the Digital Bibliography of Library Project (DBLP). For the BDBComp collection, the average between the quality of the generated groups and its fragmentation was over the mark of 95%, and for the collection of the DBLP, this average was over 65%.Universidade Federal de Minas GeraisUFMGCatalogo de autoridadeBibliotecas digitaisMetadadosComputaçãoSistemas de recuperação da informaçãoidentificação de autoriaUma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALjeanwanderleialvesoliveira.pdfapplication/pdf494105https://repositorio.ufmg.br/bitstream/1843/RVMR-6EAGQK/1/jeanwanderleialvesoliveira.pdf18b8bfe0205479331142d45f195d3c8dMD51TEXTjeanwanderleialvesoliveira.pdf.txtjeanwanderleialvesoliveira.pdf.txtExtracted texttext/plain133678https://repositorio.ufmg.br/bitstream/1843/RVMR-6EAGQK/2/jeanwanderleialvesoliveira.pdf.txtbc8f1860224f6466fc5aeb436ef160bfMD521843/RVMR-6EAGQK2019-11-14 05:08:04.763oai:repositorio.ufmg.br:1843/RVMR-6EAGQKRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T08:08:04Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
title Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
spellingShingle Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
Jean Wanderlei Alves de Oliveira
identificação de autoria
Catalogo de autoridade
Bibliotecas digitais
Metadados
Computação
Sistemas de recuperação da informação
title_short Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
title_full Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
title_fullStr Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
title_full_unstemmed Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
title_sort Uma estratégia para remoção de ambiguidades na identificação de autoria de objetos bibliográficos
author Jean Wanderlei Alves de Oliveira
author_facet Jean Wanderlei Alves de Oliveira
author_role author
dc.contributor.advisor1.fl_str_mv Alberto Henrique Frade Laender
dc.contributor.referee1.fl_str_mv Marcello Peixoto Bax
dc.contributor.referee2.fl_str_mv Marcos André Gonçalves
dc.contributor.referee3.fl_str_mv Osvaldo Sergio Farhat de Carvalho
dc.contributor.author.fl_str_mv Jean Wanderlei Alves de Oliveira
contributor_str_mv Alberto Henrique Frade Laender
Marcello Peixoto Bax
Marcos André Gonçalves
Osvaldo Sergio Farhat de Carvalho
dc.subject.por.fl_str_mv identificação de autoria
topic identificação de autoria
Catalogo de autoridade
Bibliotecas digitais
Metadados
Computação
Sistemas de recuperação da informação
dc.subject.other.pt_BR.fl_str_mv Catalogo de autoridade
Bibliotecas digitais
Metadados
Computação
Sistemas de recuperação da informação
description O problema de sobrecarga informacional gerado pelo sucesso da Web provocou o surgimento de serviços que reúnem informações em contextos específicos, conhecidos como bibliotecas digitais. Bibliotecas digitais reúnem informações digitais e metadados que freqüentemente são obtidos a partir de fontes diversas. A não padronização dos metadados oriundos dessas fontes traz como consequência a ambiguidade em determinados campos. Nesta dissertação apresentamos uma estratégia para o tratamento de ambiguidades encontradas em campos referentes a nomes de autores em bibliotecas digitais. Nossa estratégia utiliza técnicas de recuperação de informação associadas a um algoritmo de agrupamento que permite a criação de arquivos de autoridade. Demonstramos a eficácia de nossa estratégia através da realização de experimentos sobre duas coleções de teste derivadas da Biblioteca Digital Brasileira de Computação (BDBComp) e Digital Bibliography of Library Project (DBLP). Para a coleção da BDBComp, a média entre a qualidade dos grupos gerados e sua fragmentação foi superior à marca de 90%, e para a coleção da DBLP, essa média foi superior a 65%.
publishDate 2005
dc.date.issued.fl_str_mv 2005-04-01
dc.date.accessioned.fl_str_mv 2019-08-11T16:54:18Z
dc.date.available.fl_str_mv 2019-08-11T16:54:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-6EAGQK
url http://hdl.handle.net/1843/RVMR-6EAGQK
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-6EAGQK/1/jeanwanderleialvesoliveira.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-6EAGQK/2/jeanwanderleialvesoliveira.pdf.txt
bitstream.checksum.fl_str_mv 18b8bfe0205479331142d45f195d3c8d
bc8f1860224f6466fc5aeb436ef160bf
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676769311326208