Processamento de consultas documento-a-documento utilizando índice em camadas

Rossi, Cristian; http://lattes.cnpq.br/4835067852871475

Processamento de consultas documento-a-documento utilizando índice em camadas

Detalhes bibliográficos
Autor(a) principal:	Rossi, Cristian
Data de Publicação:	2013
Outros Autores:	http://lattes.cnpq.br/4835067852871475
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFAM
Texto Completo:	http://tede.ufam.edu.br/handle/tede/4123
Resumo:	Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW.

Metadados do item

id	UFAM_62f96b6b3cead5fc0e9a4080224cf94d
oai_identifier_str	oai:https://tede.ufam.edu.br/handle/:tede/4123
network_acronym_str	UFAM
network_name_str	Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str	6592
spelling	Processamento de consultas documento-a-documento utilizando índice em camadasRecuperação de informaçãoProcessamento de consultasÍndices invertidosSistemas de buscaInformation retrievalIndexes reversedSearch systemsCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOSistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW.Search engines are mechanisms to seek relevant information within large data collections. The constant growth of electronic media for storage information, along with the popularization of search engines, brings the constant need for solutions that reduce processing costs queries. We present two new algorithms for query processing searching systems. The processing algorithms use the approach document-to-document and modify the current algorithm state of the art, BMW, for taking advantage of an index architecture divided into two layers. The first layer contains only the highest impact index entries and is used to preprocess consultations before accessing the rest of the index in the second layer. This approach results in significant performance gains. The first algorithm, called BMW-CS, is up to 40 times more fast compared to many compared methods, but causes small changes in the returned response. The second algorithm, called BMW-t, preserves the answer set and is 10% faster than the BMW.FAPEAM - Fundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaMoura, Edleno Silva dehttp://lattes.cnpq.br/4737852130924504Rossi, Cristianhttp://lattes.cnpq.br/48350678528714752015-06-17T20:42:11Z2013-03-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfROSSI, Cristian. Processamento de consultas documento-a-documento utilizando índice em camadas. 2013. 67 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.http://tede.ufam.edu.br/handle/tede/4123porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-05-11T14:36:23Zoai:https://tede.ufam.edu.br/handle/:tede/4123Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br\|\|ddbc@ufam.edu.bropendoar:65922016-05-11T14:36:23Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv	Processamento de consultas documento-a-documento utilizando índice em camadas
title	Processamento de consultas documento-a-documento utilizando índice em camadas
spellingShingle	Processamento de consultas documento-a-documento utilizando índice em camadas Rossi, Cristian Recuperação de informação Processamento de consultas Índices invertidos Sistemas de busca Information retrieval Indexes reversed Search systems CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short	Processamento de consultas documento-a-documento utilizando índice em camadas
title_full	Processamento de consultas documento-a-documento utilizando índice em camadas
title_fullStr	Processamento de consultas documento-a-documento utilizando índice em camadas
title_full_unstemmed	Processamento de consultas documento-a-documento utilizando índice em camadas
title_sort	Processamento de consultas documento-a-documento utilizando índice em camadas
author	Rossi, Cristian
author_facet	Rossi, Cristian http://lattes.cnpq.br/4835067852871475
author_role	author
author2	http://lattes.cnpq.br/4835067852871475
author2_role	author
dc.contributor.none.fl_str_mv	Moura, Edleno Silva de http://lattes.cnpq.br/4737852130924504
dc.contributor.author.fl_str_mv	Rossi, Cristian http://lattes.cnpq.br/4835067852871475
dc.subject.por.fl_str_mv	Recuperação de informação Processamento de consultas Índices invertidos Sistemas de busca Information retrieval Indexes reversed Search systems CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic	Recuperação de informação Processamento de consultas Índices invertidos Sistemas de busca Information retrieval Indexes reversed Search systems CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description	Sistemas de busca são mecanismos capazes de buscar informação relevante dentro de grandes coleções de dados. O constante crescimento de meios eletrônicos para armazenamento de informação, junto com a popularização dos sistemas de busca, traz consigo a necessidade constante por soluções capazes de reduzir os custos de processamento de consultas. Neste trabalho, apresentamos dois novos algoritmos para processamento de consultas em sistemas de busca. Os algoritmos utilizam a abordagem de processamento documento-a-documento e modificam o atual algoritmo estado-da-arte, BMW, para tirar vantagem de uma arquitetura de índice dividido em duas camadas. A primeira camada contém apenas as entradas de maior impacto do índice e é utilizada para preprocessar as consultas antes de acessar o restante do índice na segunda camada. Esta abordagem resulta em consideráveis ganhos de desempenho. O primeiro algoritmo proposto, chamado BMW-CS, chega a ser 40 vezes mais rápido em relação a diversos métodos comparados, porém provoca pequenas modificações no conjunto de resposta retornado. O segundo algoritmo proposto, chamado BMW-t, preserva o conjunto de resposta e é 10% mais rápido que o BMW.
publishDate	2013
dc.date.none.fl_str_mv	2013-03-27 2015-06-17T20:42:11Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	ROSSI, Cristian. Processamento de consultas documento-a-documento utilizando índice em camadas. 2013. 67 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013. http://tede.ufam.edu.br/handle/tede/4123
identifier_str_mv	ROSSI, Cristian. Processamento de consultas documento-a-documento utilizando índice em camadas. 2013. 67 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2013.
url	http://tede.ufam.edu.br/handle/tede/4123
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
publisher.none.fl_str_mv	Universidade Federal do Amazonas Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM
instname_str	Universidade Federal do Amazonas (UFAM)
instacron_str	UFAM
institution	UFAM
reponame_str	Biblioteca Digital de Teses e Dissertações da UFAM
collection	Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv	ddbc@ufam.edu.br\|\|ddbc@ufam.edu.br
_version_	1809732010508288000

Processamento de consultas documento-a-documento utilizando índice em camadas

Registros relacionados