Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital
Autor(a) principal: | |
---|---|
Data de Publicação: | 2007 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/RVMR-794QAJ |
Resumo: | Esta dissertação propõe um processo que utiliza resultados de consultas submetidas a máquinas de busca para encontrar a URL do texto completo correspondente, ou de qualquer outro material relacionado, a artigos catalogados em uma biblioteca digital que não possuem tal informação registrada. Apresentamos um estudo desse processo para investigar diferentes estratégias de consultas aplicadas a três máquinas de busca de propósito geral (Google, Yahoo!, MSN) e a duas especializadas (Scholar e CiteSeer) considerando vários cenários caracterizados por usuários com diferentes níveis de exigências. Especificamente, conduzimos um conjunto de experimentos com artigos provenientes da BDBComp - Biblioteca Digital Brasileira de Computação e da DBLP - Digital Bibliography & Library Project. De acordo com os resultados, Scholar mostrou-se mais eficaz nesta tarefa do que as outras máquinas de busca testadas em todos os cenários estudados. Além disso, nossos experimentos mostraram que estratégias simples para combinação e reordenação fornecem resultados ainda melhores. Nosso estudo também apresenta uma análise do impacto de diferentes fatores na chance de se encontrar o texto completo dos artigos procurados. |
id |
UFMG_b2542477e544ab678549ac0cd2fe5970 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/RVMR-794QAJ |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Alberto Henrique Frade LaenderMarcos Andre GoncalvesEdleno Silva de MouraNivio ZivianiAllan Jones Costa e Silva2019-08-14T22:14:20Z2019-08-14T22:14:20Z2007-03-26http://hdl.handle.net/1843/RVMR-794QAJEsta dissertação propõe um processo que utiliza resultados de consultas submetidas a máquinas de busca para encontrar a URL do texto completo correspondente, ou de qualquer outro material relacionado, a artigos catalogados em uma biblioteca digital que não possuem tal informação registrada. Apresentamos um estudo desse processo para investigar diferentes estratégias de consultas aplicadas a três máquinas de busca de propósito geral (Google, Yahoo!, MSN) e a duas especializadas (Scholar e CiteSeer) considerando vários cenários caracterizados por usuários com diferentes níveis de exigências. Especificamente, conduzimos um conjunto de experimentos com artigos provenientes da BDBComp - Biblioteca Digital Brasileira de Computação e da DBLP - Digital Bibliography & Library Project. De acordo com os resultados, Scholar mostrou-se mais eficaz nesta tarefa do que as outras máquinas de busca testadas em todos os cenários estudados. Além disso, nossos experimentos mostraram que estratégias simples para combinação e reordenação fornecem resultados ainda melhores. Nosso estudo também apresenta uma análise do impacto de diferentes fatores na chance de se encontrar o texto completo dos artigos procurados.This dissertation proposes a process that uses results from queries submitted to search engines for finding the URL of the corresponding full-text, or of any relevant related material, for those articles cataloged in a digital library for which this information is missing. We present a comprehensive study of this process in different situations by investigating different query strategies applied to three general purpose search engines (Google, Yahoo!, MSN) and two specialized ones (Scholar and CiteSeer), considering five user scenarios characterized by distinct requirement levels. Specifically, we have conducted a set of experiments focused on articles taken from BDBComp - Brazilian Digital Library of Computing and DBLP - Digital Bibliography & Library Project. According to the results of these experiments, Scholar has shown to be more effective than the other tested search engines for this task in all considered scenarios. Moreover, our experiments show that a simple combination Scholar-Google with a re-ranking strategy provides even better results. Our study also presents an analysis of the impact of different factors on the likelihood of finding the full-text of the searched articles.Universidade Federal de Minas GeraisUFMGRecuperação da informaçãoBibliotecas digitaisWorld Wide Web (Sistema de recuperação da informação)ComputaçãoSistemas de recuperação da informaçãobusca em textobiblioteca digitalEstratégias para busca do texto completo de artigos catalogados em uma biblioteca digitalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALallanjonescostasilva.pdfapplication/pdf574985https://repositorio.ufmg.br/bitstream/1843/RVMR-794QAJ/1/allanjonescostasilva.pdfd9c8a8fcd4c43e87ae5357ce908e6d6fMD51TEXTallanjonescostasilva.pdf.txtallanjonescostasilva.pdf.txtExtracted texttext/plain136211https://repositorio.ufmg.br/bitstream/1843/RVMR-794QAJ/2/allanjonescostasilva.pdf.txtca643279502374d2af7c910e9617068dMD521843/RVMR-794QAJ2019-11-14 17:07:06.733oai:repositorio.ufmg.br:1843/RVMR-794QAJRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:07:06Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
title |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
spellingShingle |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital Allan Jones Costa e Silva busca em texto biblioteca digital Recuperação da informação Bibliotecas digitais World Wide Web (Sistema de recuperação da informação) Computação Sistemas de recuperação da informação |
title_short |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
title_full |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
title_fullStr |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
title_full_unstemmed |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
title_sort |
Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital |
author |
Allan Jones Costa e Silva |
author_facet |
Allan Jones Costa e Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Alberto Henrique Frade Laender |
dc.contributor.advisor-co1.fl_str_mv |
Marcos Andre Goncalves |
dc.contributor.referee1.fl_str_mv |
Edleno Silva de Moura |
dc.contributor.referee2.fl_str_mv |
Nivio Ziviani |
dc.contributor.author.fl_str_mv |
Allan Jones Costa e Silva |
contributor_str_mv |
Alberto Henrique Frade Laender Marcos Andre Goncalves Edleno Silva de Moura Nivio Ziviani |
dc.subject.por.fl_str_mv |
busca em texto biblioteca digital |
topic |
busca em texto biblioteca digital Recuperação da informação Bibliotecas digitais World Wide Web (Sistema de recuperação da informação) Computação Sistemas de recuperação da informação |
dc.subject.other.pt_BR.fl_str_mv |
Recuperação da informação Bibliotecas digitais World Wide Web (Sistema de recuperação da informação) Computação Sistemas de recuperação da informação |
description |
Esta dissertação propõe um processo que utiliza resultados de consultas submetidas a máquinas de busca para encontrar a URL do texto completo correspondente, ou de qualquer outro material relacionado, a artigos catalogados em uma biblioteca digital que não possuem tal informação registrada. Apresentamos um estudo desse processo para investigar diferentes estratégias de consultas aplicadas a três máquinas de busca de propósito geral (Google, Yahoo!, MSN) e a duas especializadas (Scholar e CiteSeer) considerando vários cenários caracterizados por usuários com diferentes níveis de exigências. Especificamente, conduzimos um conjunto de experimentos com artigos provenientes da BDBComp - Biblioteca Digital Brasileira de Computação e da DBLP - Digital Bibliography & Library Project. De acordo com os resultados, Scholar mostrou-se mais eficaz nesta tarefa do que as outras máquinas de busca testadas em todos os cenários estudados. Além disso, nossos experimentos mostraram que estratégias simples para combinação e reordenação fornecem resultados ainda melhores. Nosso estudo também apresenta uma análise do impacto de diferentes fatores na chance de se encontrar o texto completo dos artigos procurados. |
publishDate |
2007 |
dc.date.issued.fl_str_mv |
2007-03-26 |
dc.date.accessioned.fl_str_mv |
2019-08-14T22:14:20Z |
dc.date.available.fl_str_mv |
2019-08-14T22:14:20Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/RVMR-794QAJ |
url |
http://hdl.handle.net/1843/RVMR-794QAJ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/RVMR-794QAJ/1/allanjonescostasilva.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-794QAJ/2/allanjonescostasilva.pdf.txt |
bitstream.checksum.fl_str_mv |
d9c8a8fcd4c43e87ae5357ce908e6d6f ca643279502374d2af7c910e9617068d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1797971108970889216 |