Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação

Detalhes bibliográficos
Autor(a) principal: Fernandes, Marcelo Rômulo
Data de Publicação: 2001
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000pn9n
Texto Completo: https://repositorio.ufpe.br/handle/123456789/2545
Resumo: A Internet é uma das principais fontes de informação utilizadas no apoio à solução de problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos meios mais utilizados para pesquisa de informação nesse ambiente. Observa-se que o tamanho extraordinário, o crescimento exponencial e a elevada taxa de modificação da World-Wide-Web (www) requerem novas abordagens aos problemas de indexação e pesquisa de informação na estrutura dos Engenhos de Busca. Neste trabalho, uma solução distribuída para operação de Engenhos de Busca é apresentada, visando escalabilidade e atualidade. São comentadas arquiteturas distribuídas para Engenhos de Busca. Apresenta-se o Radix, um Engenho de Busca distribuído para indexar e pesquisar informação na www, baseado em visões Web. Um protótipo é desenvolvido, focalizando a implementação de crawling e indexação do Radix distribuído, a fim de validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre Engenhos de Busca centralizados e distribuídos é apresentado, encorajando o uso de técnicas de distribuição para elevar os valores de cobertura e atualidade desses sistemas
id UFPE_80d1e63ec803a933120e6412d5b80473
oai_identifier_str oai:repositorio.ufpe.br:123456789/2545
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling Fernandes, Marcelo RômuloMeira, Silvio Romero de Lemos2014-06-12T15:59:10Z2014-06-12T15:59:10Z2001Rômulo Fernandes, Marcelo; Romero de Lemos Meira, Silvio. Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação. 2001. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2001.https://repositorio.ufpe.br/handle/123456789/2545ark:/64986/001300000pn9nA Internet é uma das principais fontes de informação utilizadas no apoio à solução de problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos meios mais utilizados para pesquisa de informação nesse ambiente. Observa-se que o tamanho extraordinário, o crescimento exponencial e a elevada taxa de modificação da World-Wide-Web (www) requerem novas abordagens aos problemas de indexação e pesquisa de informação na estrutura dos Engenhos de Busca. Neste trabalho, uma solução distribuída para operação de Engenhos de Busca é apresentada, visando escalabilidade e atualidade. São comentadas arquiteturas distribuídas para Engenhos de Busca. Apresenta-se o Radix, um Engenho de Busca distribuído para indexar e pesquisar informação na www, baseado em visões Web. Um protótipo é desenvolvido, focalizando a implementação de crawling e indexação do Radix distribuído, a fim de validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre Engenhos de Busca centralizados e distribuídos é apresentado, encorajando o uso de técnicas de distribuição para elevar os valores de cobertura e atualidade desses sistemasporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessEngenho de BuscaCrawling e indexaçãoSistemas distribuídosEscalabilidadeVisão WebEngenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALarquivo4931_1.pdfapplication/pdf581419https://repositorio.ufpe.br/bitstream/123456789/2545/1/arquivo4931_1.pdf6d9e1efec074c836155c1e69761c3415MD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/2545/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo4931_1.pdf.txtarquivo4931_1.pdf.txtExtracted texttext/plain151061https://repositorio.ufpe.br/bitstream/123456789/2545/3/arquivo4931_1.pdf.txt5f11796206f2df13aa920b21ba550ba9MD53THUMBNAILarquivo4931_1.pdf.jpgarquivo4931_1.pdf.jpgGenerated Thumbnailimage/jpeg1211https://repositorio.ufpe.br/bitstream/123456789/2545/4/arquivo4931_1.pdf.jpg42879c5f3db81905f5303e39fe6ee473MD54123456789/25452019-10-25 02:48:02.542oai:repositorio.ufpe.br:123456789/2545Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T05:48:02Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
title Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
spellingShingle Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
Fernandes, Marcelo Rômulo
Engenho de Busca
Crawling e indexação
Sistemas distribuídos
Escalabilidade
Visão Web
title_short Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
title_full Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
title_fullStr Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
title_full_unstemmed Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
title_sort Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação
author Fernandes, Marcelo Rômulo
author_facet Fernandes, Marcelo Rômulo
author_role author
dc.contributor.author.fl_str_mv Fernandes, Marcelo Rômulo
dc.contributor.advisor1.fl_str_mv Meira, Silvio Romero de Lemos
contributor_str_mv Meira, Silvio Romero de Lemos
dc.subject.por.fl_str_mv Engenho de Busca
Crawling e indexação
Sistemas distribuídos
Escalabilidade
Visão Web
topic Engenho de Busca
Crawling e indexação
Sistemas distribuídos
Escalabilidade
Visão Web
description A Internet é uma das principais fontes de informação utilizadas no apoio à solução de problemas. Paralelamente a este fato, os Engenhos de Busca surgem como um dos meios mais utilizados para pesquisa de informação nesse ambiente. Observa-se que o tamanho extraordinário, o crescimento exponencial e a elevada taxa de modificação da World-Wide-Web (www) requerem novas abordagens aos problemas de indexação e pesquisa de informação na estrutura dos Engenhos de Busca. Neste trabalho, uma solução distribuída para operação de Engenhos de Busca é apresentada, visando escalabilidade e atualidade. São comentadas arquiteturas distribuídas para Engenhos de Busca. Apresenta-se o Radix, um Engenho de Busca distribuído para indexar e pesquisar informação na www, baseado em visões Web. Um protótipo é desenvolvido, focalizando a implementação de crawling e indexação do Radix distribuído, a fim de validar o ambiente proposto. Um estudo de caso comparativo de desempenho entre Engenhos de Busca centralizados e distribuídos é apresentado, encorajando o uso de técnicas de distribuição para elevar os valores de cobertura e atualidade desses sistemas
publishDate 2001
dc.date.issued.fl_str_mv 2001
dc.date.accessioned.fl_str_mv 2014-06-12T15:59:10Z
dc.date.available.fl_str_mv 2014-06-12T15:59:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Rômulo Fernandes, Marcelo; Romero de Lemos Meira, Silvio. Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação. 2001. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2001.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/2545
dc.identifier.dark.fl_str_mv ark:/64986/001300000pn9n
identifier_str_mv Rômulo Fernandes, Marcelo; Romero de Lemos Meira, Silvio. Engenhos de Busca Distribuídos: Uma abordagem visando escalabilidade para Crawling e Indexação. 2001. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2001.
ark:/64986/001300000pn9n
url https://repositorio.ufpe.br/handle/123456789/2545
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/2545/1/arquivo4931_1.pdf
https://repositorio.ufpe.br/bitstream/123456789/2545/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/2545/3/arquivo4931_1.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/2545/4/arquivo4931_1.pdf.jpg
bitstream.checksum.fl_str_mv 6d9e1efec074c836155c1e69761c3415
8a4605be74aa9ea9d79846c1fba20a33
5f11796206f2df13aa920b21ba550ba9
42879c5f3db81905f5303e39fe6ee473
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172877953007616