Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas

Detalhes bibliográficos
Autor(a) principal: Alan Filipe Santana
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-A2EH2W
Resumo: A ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental.
id UFMG_0d901f5ecf8e1b922b32dd13c73b13a8
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-A2EH2W
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Marcos Andre GoncalvesAnderson Almeida FerreiraClodoveu Augusto Davis JuniorRicardo da Silva TorresAlan Filipe Santana2019-08-12T18:13:22Z2019-08-12T18:13:22Z2015-07-02http://hdl.handle.net/1843/ESBF-A2EH2WA ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental.The ambiguity of author name in bibliographic references is one of the main problems affecting the quality of services offered by digital libraries. In recent years, numerous methods for automatic name disambiguation have been proposed based on different supervised and unsupervised approaches. However, just a few have been developed in order to allow the disambiguation at the time that citations are incorporated into the digital library. In a real situation, these solutions are potentially more efficient and practical, since they avoid the need to reprocess the entire repository whenever new citations are included in the database. This paper proposes a new incremental disambiguation method based on heuristics, able to automatically create and update a training set used to determine the author of each reference. This method was evaluated in different application scenarios and compared with several solutions found in the literature. In the experimental evaluation, our solution has achieved significant gains in all collections when compared with the best supervised and unsupervised baselines. We also performed experiments to demonstrate the practicability and efficiency of the method when used in a incremental way.Universidade Federal de Minas GeraisUFMGBibliotecas digitaisComputaçãoProgramação heurística Referencias bibliograficasAmbigüidadeBibliotecas digitaisReferências bibliográficasHeurísticasAmbiguidade de nomesHeurísticas para desambiguação incremental de nomes de autores em referências bibliográficasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALalanfelipe.pdfapplication/pdf1745016https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/1/alanfelipe.pdf0ef7e253f5dc67e6859d4ae746d8ea5aMD51TEXTalanfelipe.pdf.txtalanfelipe.pdf.txtExtracted texttext/plain175360https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/2/alanfelipe.pdf.txtf8d8c873eec511cca2d2bdd5f332f0bdMD521843/ESBF-A2EH2W2019-11-14 19:12:56.113oai:repositorio.ufmg.br:1843/ESBF-A2EH2WRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T22:12:56Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
title Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
spellingShingle Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
Alan Filipe Santana
Bibliotecas digitais
Referências bibliográficas
Heurísticas
Ambiguidade de nomes
Bibliotecas digitais
Computação
Programação heurística 
Referencias bibliograficas
Ambigüidade
title_short Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
title_full Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
title_fullStr Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
title_full_unstemmed Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
title_sort Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
author Alan Filipe Santana
author_facet Alan Filipe Santana
author_role author
dc.contributor.advisor1.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee1.fl_str_mv Anderson Almeida Ferreira
dc.contributor.referee2.fl_str_mv Clodoveu Augusto Davis Junior
dc.contributor.referee3.fl_str_mv Ricardo da Silva Torres
dc.contributor.author.fl_str_mv Alan Filipe Santana
contributor_str_mv Marcos Andre Goncalves
Anderson Almeida Ferreira
Clodoveu Augusto Davis Junior
Ricardo da Silva Torres
dc.subject.por.fl_str_mv Bibliotecas digitais
Referências bibliográficas
Heurísticas
Ambiguidade de nomes
topic Bibliotecas digitais
Referências bibliográficas
Heurísticas
Ambiguidade de nomes
Bibliotecas digitais
Computação
Programação heurística 
Referencias bibliograficas
Ambigüidade
dc.subject.other.pt_BR.fl_str_mv Bibliotecas digitais
Computação
Programação heurística 
Referencias bibliograficas
Ambigüidade
description A ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental.
publishDate 2015
dc.date.issued.fl_str_mv 2015-07-02
dc.date.accessioned.fl_str_mv 2019-08-12T18:13:22Z
dc.date.available.fl_str_mv 2019-08-12T18:13:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-A2EH2W
url http://hdl.handle.net/1843/ESBF-A2EH2W
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/1/alanfelipe.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/2/alanfelipe.pdf.txt
bitstream.checksum.fl_str_mv 0ef7e253f5dc67e6859d4ae746d8ea5a
f8d8c873eec511cca2d2bdd5f332f0bd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676629222621184