Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par

Detalhes bibliográficos
Autor(a) principal: Fabiano Magalhaes Atalla da Fonseca
Data de Publicação: 2008
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-7L6J36
Resumo: Na tentativa de ampliar o espectro de busca e atenuar problemas de escalabilidade, redes Par-a-Par (P2P) têm sido apontadas como alternativa para novas gerações de máquinas de busca na Web. No entanto, a eficácia da busca por conteúdo em ambientes P2P pode ser gravemente limitada por características observadas em sistemas P2P reais, tais como a entrada e saída dinâmica de pares no sistema. Nosso estudo analisa o impacto desse aspecto na eficácia de máquinas de busca P2P. De forma a estimar os limites da eficácia, focamos nossa análise em modelos de rede P2P com níveis extremos de conhecimento dos pares sobre os documentos da rede. Nossos resultados revelam que o comportamento dinâmico dos pares pode afetar consideravelmente a eficácia da busca mesmo em cenários otimistas: em redes com altos níveis de conhecimento dos pares sobre os documentos da rede, uma fração significativa de consultas sofre um impacto na qualidade das respostas de pelo menos 26% ainda em cenários muito estáveis. Também confirmamos que o impacto desse aspecto em redes com baixos níveis de conhecimento dos pares pode ser ainda mais grave (75%). Também avaliamos a replicação de conteúdo como possível forma de atenuar os efeitos do comportamento dinâmico dos pares na eficácia de máquinas de busca P2P. Para tanto, analisamos o efeito de os usuários baixarem algumas páginas listadas na resposta à consulta e as adicionarem à sua coleção local. Observamos que essa estratégia pode melhorar significativamente a eficácia de máquinas de busca P2P. De fato, a qualidade das respostas em redes com níveis muito baixos de nhecimento dos pares sobre os documentos da rede pode melhorar significativamente mesmo em cenários pouco estáveis. Também discutimos os desafios existentes para adoção dessa solução. De fato, considerando a grande autonomia dos pares e a ausência dos benefícios da replicação comuns em sistemas P2P de compartilhamento de arquivos, o desenvolvimento das futuras máquinas de busca P2P pode depender amplamente de novos mecanismos de incentivo que considerem aspectos específicos desse tipo de aplicação.
id UFMG_e3717f88bf6bc5d38f7885bea0ab1fdc
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-7L6J36
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Virgilio Augusto Fernandes AlmeidaJussara Marques de AlmeidaMarcos Andre GoncalvesNivio ZivianiWagner Meira JuniorFabiano Magalhaes Atalla da Fonseca2019-08-14T20:36:56Z2019-08-14T20:36:56Z2008-07-01http://hdl.handle.net/1843/RVMR-7L6J36Na tentativa de ampliar o espectro de busca e atenuar problemas de escalabilidade, redes Par-a-Par (P2P) têm sido apontadas como alternativa para novas gerações de máquinas de busca na Web. No entanto, a eficácia da busca por conteúdo em ambientes P2P pode ser gravemente limitada por características observadas em sistemas P2P reais, tais como a entrada e saída dinâmica de pares no sistema. Nosso estudo analisa o impacto desse aspecto na eficácia de máquinas de busca P2P. De forma a estimar os limites da eficácia, focamos nossa análise em modelos de rede P2P com níveis extremos de conhecimento dos pares sobre os documentos da rede. Nossos resultados revelam que o comportamento dinâmico dos pares pode afetar consideravelmente a eficácia da busca mesmo em cenários otimistas: em redes com altos níveis de conhecimento dos pares sobre os documentos da rede, uma fração significativa de consultas sofre um impacto na qualidade das respostas de pelo menos 26% ainda em cenários muito estáveis. Também confirmamos que o impacto desse aspecto em redes com baixos níveis de conhecimento dos pares pode ser ainda mais grave (75%). Também avaliamos a replicação de conteúdo como possível forma de atenuar os efeitos do comportamento dinâmico dos pares na eficácia de máquinas de busca P2P. Para tanto, analisamos o efeito de os usuários baixarem algumas páginas listadas na resposta à consulta e as adicionarem à sua coleção local. Observamos que essa estratégia pode melhorar significativamente a eficácia de máquinas de busca P2P. De fato, a qualidade das respostas em redes com níveis muito baixos de nhecimento dos pares sobre os documentos da rede pode melhorar significativamente mesmo em cenários pouco estáveis. Também discutimos os desafios existentes para adoção dessa solução. De fato, considerando a grande autonomia dos pares e a ausência dos benefícios da replicação comuns em sistemas P2P de compartilhamento de arquivos, o desenvolvimento das futuras máquinas de busca P2P pode depender amplamente de novos mecanismos de incentivo que considerem aspectos específicos desse tipo de aplicação.In an attempt to increase the spectrum of searchable information while attenuating scalability issues, Peer-to-Peer (P2P) networks have been viewed as an alternative way to design new Web search engines. However, the effectiveness of P2P Web searching may be severely limited by characteristics commonly observed in real P2P systems such as the dynamics of peer participation (churn). This study analyzes the impact of such issue on the effectiveness of P2P Web search engines. In order to estimate effectiveness boundaries, we focus our analysis on P2P network models with very high and low levels of peer knowledge about documents on the network. Our findings reveal that peer dynamic behavior could strongly affect search effectiveness even in optimistic scenarios: in networks where peers have a high knowledge about documents on the network, a significant fraction of queries suffer an impact on the quality of search of at least 26% still in highly stable scenarios. We also confirm that the impact of such issue in networks where peers have a lower level of knowledge can be even more intense (75%). We also evaluate content replication as a possible way to attenuate the effects of peer dynamic behavior on the effectiveness of P2P search engines. To this end, we analyze the effect of users downloading some ranked Web pages and adding them to their local collection. We observe that such strategy can significantly improve the effectiveness of P2P Web searching. In fact, the quality of results of networks with a very low level of peer knowledge about documents on the network can be significantly improved even in lowly stable scenarios. We then discuss some imposed challenges for the adoption of such solution. Actually, together with the high autonomy of peers and the absence of file-sharing benefits in replicating documents into the network, effectiveness of P2P Web search engines may strongly depend on new, application-specific incentive mechanisms for the users.Universidade Federal de Minas GeraisUFMGSistemas de recuperação da informação Redes de computaçãoComputadores digitais AvaliaçãoFerramentas de busca na WebComputaçãoRedes de computaçãorecuperacao de informacaoredes de computadoresImpacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-parinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertacao_fabianomagalhaesatalladafonseca.pdfapplication/pdf730920https://repositorio.ufmg.br/bitstream/1843/RVMR-7L6J36/1/dissertacao_fabianomagalhaesatalladafonseca.pdf1e98708469c8dd97c0a9a9e3c7a208f9MD51TEXTdissertacao_fabianomagalhaesatalladafonseca.pdf.txtdissertacao_fabianomagalhaesatalladafonseca.pdf.txtExtracted texttext/plain128436https://repositorio.ufmg.br/bitstream/1843/RVMR-7L6J36/2/dissertacao_fabianomagalhaesatalladafonseca.pdf.txtfa7d85283172bca280a637584c19f55dMD521843/RVMR-7L6J362019-11-14 15:02:05.282oai:repositorio.ufmg.br:1843/RVMR-7L6J36Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T18:02:05Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
title Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
spellingShingle Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
Fabiano Magalhaes Atalla da Fonseca
recuperacao de informacao
redes de computadores
Sistemas de recuperação da informação Redes de computação
Computadores digitais Avaliação
Ferramentas de busca na Web
Computação
Redes de computação
title_short Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
title_full Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
title_fullStr Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
title_full_unstemmed Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
title_sort Impacto do comportamento dinâmico dos pares na eficácia de máquinas de busca par-a-par
author Fabiano Magalhaes Atalla da Fonseca
author_facet Fabiano Magalhaes Atalla da Fonseca
author_role author
dc.contributor.advisor1.fl_str_mv Virgilio Augusto Fernandes Almeida
dc.contributor.referee1.fl_str_mv Jussara Marques de Almeida
dc.contributor.referee2.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee3.fl_str_mv Nivio Ziviani
dc.contributor.referee4.fl_str_mv Wagner Meira Junior
dc.contributor.author.fl_str_mv Fabiano Magalhaes Atalla da Fonseca
contributor_str_mv Virgilio Augusto Fernandes Almeida
Jussara Marques de Almeida
Marcos Andre Goncalves
Nivio Ziviani
Wagner Meira Junior
dc.subject.por.fl_str_mv recuperacao de informacao
redes de computadores
topic recuperacao de informacao
redes de computadores
Sistemas de recuperação da informação Redes de computação
Computadores digitais Avaliação
Ferramentas de busca na Web
Computação
Redes de computação
dc.subject.other.pt_BR.fl_str_mv Sistemas de recuperação da informação Redes de computação
Computadores digitais Avaliação
Ferramentas de busca na Web
Computação
Redes de computação
description Na tentativa de ampliar o espectro de busca e atenuar problemas de escalabilidade, redes Par-a-Par (P2P) têm sido apontadas como alternativa para novas gerações de máquinas de busca na Web. No entanto, a eficácia da busca por conteúdo em ambientes P2P pode ser gravemente limitada por características observadas em sistemas P2P reais, tais como a entrada e saída dinâmica de pares no sistema. Nosso estudo analisa o impacto desse aspecto na eficácia de máquinas de busca P2P. De forma a estimar os limites da eficácia, focamos nossa análise em modelos de rede P2P com níveis extremos de conhecimento dos pares sobre os documentos da rede. Nossos resultados revelam que o comportamento dinâmico dos pares pode afetar consideravelmente a eficácia da busca mesmo em cenários otimistas: em redes com altos níveis de conhecimento dos pares sobre os documentos da rede, uma fração significativa de consultas sofre um impacto na qualidade das respostas de pelo menos 26% ainda em cenários muito estáveis. Também confirmamos que o impacto desse aspecto em redes com baixos níveis de conhecimento dos pares pode ser ainda mais grave (75%). Também avaliamos a replicação de conteúdo como possível forma de atenuar os efeitos do comportamento dinâmico dos pares na eficácia de máquinas de busca P2P. Para tanto, analisamos o efeito de os usuários baixarem algumas páginas listadas na resposta à consulta e as adicionarem à sua coleção local. Observamos que essa estratégia pode melhorar significativamente a eficácia de máquinas de busca P2P. De fato, a qualidade das respostas em redes com níveis muito baixos de nhecimento dos pares sobre os documentos da rede pode melhorar significativamente mesmo em cenários pouco estáveis. Também discutimos os desafios existentes para adoção dessa solução. De fato, considerando a grande autonomia dos pares e a ausência dos benefícios da replicação comuns em sistemas P2P de compartilhamento de arquivos, o desenvolvimento das futuras máquinas de busca P2P pode depender amplamente de novos mecanismos de incentivo que considerem aspectos específicos desse tipo de aplicação.
publishDate 2008
dc.date.issued.fl_str_mv 2008-07-01
dc.date.accessioned.fl_str_mv 2019-08-14T20:36:56Z
dc.date.available.fl_str_mv 2019-08-14T20:36:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-7L6J36
url http://hdl.handle.net/1843/RVMR-7L6J36
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-7L6J36/1/dissertacao_fabianomagalhaesatalladafonseca.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-7L6J36/2/dissertacao_fabianomagalhaesatalladafonseca.pdf.txt
bitstream.checksum.fl_str_mv 1e98708469c8dd97c0a9a9e3c7a208f9
fa7d85283172bca280a637584c19f55d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589197263536128