Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-A2EH2W |
Resumo: | A ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental. |
id |
UFMG_0d901f5ecf8e1b922b32dd13c73b13a8 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-A2EH2W |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Marcos Andre GoncalvesAnderson Almeida FerreiraClodoveu Augusto Davis JuniorRicardo da Silva TorresAlan Filipe Santana2019-08-12T18:13:22Z2019-08-12T18:13:22Z2015-07-02http://hdl.handle.net/1843/ESBF-A2EH2WA ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental.The ambiguity of author name in bibliographic references is one of the main problems affecting the quality of services offered by digital libraries. In recent years, numerous methods for automatic name disambiguation have been proposed based on different supervised and unsupervised approaches. However, just a few have been developed in order to allow the disambiguation at the time that citations are incorporated into the digital library. In a real situation, these solutions are potentially more efficient and practical, since they avoid the need to reprocess the entire repository whenever new citations are included in the database. This paper proposes a new incremental disambiguation method based on heuristics, able to automatically create and update a training set used to determine the author of each reference. This method was evaluated in different application scenarios and compared with several solutions found in the literature. In the experimental evaluation, our solution has achieved significant gains in all collections when compared with the best supervised and unsupervised baselines. We also performed experiments to demonstrate the practicability and efficiency of the method when used in a incremental way.Universidade Federal de Minas GeraisUFMGBibliotecas digitaisComputaçãoProgramação heurística Referencias bibliograficasAmbigüidadeBibliotecas digitaisReferências bibliográficasHeurísticasAmbiguidade de nomesHeurísticas para desambiguação incremental de nomes de autores em referências bibliográficasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALalanfelipe.pdfapplication/pdf1745016https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/1/alanfelipe.pdf0ef7e253f5dc67e6859d4ae746d8ea5aMD51TEXTalanfelipe.pdf.txtalanfelipe.pdf.txtExtracted texttext/plain175360https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/2/alanfelipe.pdf.txtf8d8c873eec511cca2d2bdd5f332f0bdMD521843/ESBF-A2EH2W2019-11-14 19:12:56.113oai:repositorio.ufmg.br:1843/ESBF-A2EH2WRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T22:12:56Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
title |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
spellingShingle |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas Alan Filipe Santana Bibliotecas digitais Referências bibliográficas Heurísticas Ambiguidade de nomes Bibliotecas digitais Computação Programação heurística Referencias bibliograficas Ambigüidade |
title_short |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
title_full |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
title_fullStr |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
title_full_unstemmed |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
title_sort |
Heurísticas para desambiguação incremental de nomes de autores em referências bibliográficas |
author |
Alan Filipe Santana |
author_facet |
Alan Filipe Santana |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Marcos Andre Goncalves |
dc.contributor.referee1.fl_str_mv |
Anderson Almeida Ferreira |
dc.contributor.referee2.fl_str_mv |
Clodoveu Augusto Davis Junior |
dc.contributor.referee3.fl_str_mv |
Ricardo da Silva Torres |
dc.contributor.author.fl_str_mv |
Alan Filipe Santana |
contributor_str_mv |
Marcos Andre Goncalves Anderson Almeida Ferreira Clodoveu Augusto Davis Junior Ricardo da Silva Torres |
dc.subject.por.fl_str_mv |
Bibliotecas digitais Referências bibliográficas Heurísticas Ambiguidade de nomes |
topic |
Bibliotecas digitais Referências bibliográficas Heurísticas Ambiguidade de nomes Bibliotecas digitais Computação Programação heurística Referencias bibliograficas Ambigüidade |
dc.subject.other.pt_BR.fl_str_mv |
Bibliotecas digitais Computação Programação heurística Referencias bibliograficas Ambigüidade |
description |
A ambiguidade de nomes de autores em referencias bibliográficas é um dos principais problemas que afetam a qualidade dos servidos oferecidos pelas bibliotecas digitais. Nos últimos anos, inúmeros métodos automáticos de desambiguação de nomes em referências bibliográficas foram propostos baseados em diferentes abordagens supervisionadas e não supervisionadas. Entretanto, poucos foram desenvolvidos com o objetivo de permitir a desambiguação das citações no momento em que elas são incluídas no repositório de uma biblioteca digital. Em um cenário real, estas soluções são potencialmente mais práticas e eficientes, uma vez que evitam a necessidade de reprocessar todo repositório sempre que novas citações são incluídas no banco de dados. Neste trabalho é proposto um novo método de desambiguação incremental baseado em heurísticas, capaz de criar e atualizar automaticamente um conjunto de treinamento utilizado para determinar os autores de cada citação. Este método foi avaliado em diferentes cenários de aplicação e comparado com várias soluções encontradas na literatura. Na avaliação experimental, foram obtidos ganhos significativos em todas as coleções utilizadas em relação aos melhores baselines supervisionados e não-supervisionados. Também foram realizados experimentos a fim de demonstrar a praticidade e eficiência do método ao realizar a desambiguação de coleções de forma incremental. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-07-02 |
dc.date.accessioned.fl_str_mv |
2019-08-12T18:13:22Z |
dc.date.available.fl_str_mv |
2019-08-12T18:13:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-A2EH2W |
url |
http://hdl.handle.net/1843/ESBF-A2EH2W |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/1/alanfelipe.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-A2EH2W/2/alanfelipe.pdf.txt |
bitstream.checksum.fl_str_mv |
0ef7e253f5dc67e6859d4ae746d8ea5a f8d8c873eec511cca2d2bdd5f332f0bd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589162414112768 |