Processamento distribuído da consulta espaço textual top-k

Detalhes bibliográficos
Autor(a) principal: Novaes, Tiago Fernandes de Athayde
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UEFS
Texto Completo: http://localhost:8080/tede/handle/tede/530
Resumo: With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets.
id UEFS_5518fe6631342c8d5ec96177e743c4fe
oai_identifier_str oai:tede2.uefs.br:8080:tede/530
network_acronym_str UEFS
network_name_str Biblioteca Digital de Teses e Dissertações da UEFS
repository_id_str
spelling Rocha Junior, João Batista0277881846400553970500http://lattes.cnpq.br/5741698898011472Novaes, Tiago Fernandes de Athayde2017-11-28T21:38:06Z2017-07-17NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017.http://localhost:8080/tede/handle/tede/530With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets.Com a popularização de bases de dados contendo objetos que possuem informação espacial e textual (objeto espaço-textual), aumentou o interesse por novas consultas e técnicas capazes de recuperar esses objetos de forma eficiente. Uma das principais consultas para objetos espaço-textuais é a consulta espaço-textual top-k. Essa consulta visa recuperar os k melhores objetos considerando a distância do objeto até um local informado na consulta e a similaridade textual entre palavras-chave de busca e a informação textual dos objetos. No entanto, a maioria dos estudos para consultas espaço-textual top-k assumem ambientes centralizados, não abordando problemas frequentes em aplicações do mundo real como escalabilidade. Nesta dissertação são estudadas diferentes formas de particionar os dados e o impacto destes particionamentos no processamento da consulta espaço-textual top-k em um ambiente distribuído. Todas as estratégias propostas são avaliadas em um ambiente distribuído real, utilizando dados reais.Submitted by Ricardo Cedraz Duque Moliterno (ricardo.moliterno@uefs.br) on 2017-11-28T21:38:06Z No. of bitstreams: 1 dissertacao-versao-final.pdf: 2717503 bytes, checksum: a1476bba65482b40daa1a139191ea912 (MD5)Made available in DSpace on 2017-11-28T21:38:06Z (GMT). No. of bitstreams: 1 dissertacao-versao-final.pdf: 2717503 bytes, checksum: a1476bba65482b40daa1a139191ea912 (MD5) Previous issue date: 2017-07-17application/pdfporUniversidade Estadual de Feira de SantanaMestrado em Computação AplicadaUEFSBrasilDEPARTAMENTO DE CIÊNCIAS EXATASParticionamento de dadosProcessamento de consultas distribuídasConsultas espaço-textuaisSistemas de informaçãoRecuperação de informaçãoData partitioningDistributed query processingSpatio-textual queryInformation systemsInformation retrievalCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProcessamento distribuído da consulta espaço textual top-kinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis355362735868409509260060060079947400822895908073671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEFSinstname:Universidade Estadual de Feira de Santana (UEFS)instacron:UEFSORIGINALdissertacao-versao-final.pdfdissertacao-versao-final.pdfapplication/pdf2717503http://tede2.uefs.br:8080/bitstream/tede/530/2/dissertacao-versao-final.pdfa1476bba65482b40daa1a139191ea912MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede2.uefs.br:8080/bitstream/tede/530/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/5302017-11-28 18:38:06.722oai:tede2.uefs.br:8080:tede/530Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.uefs.br:8080/PUBhttp://tede2.uefs.br:8080/oai/requestbcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.bropendoar:2017-11-28T21:38:06Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)false
dc.title.por.fl_str_mv Processamento distribuído da consulta espaço textual top-k
title Processamento distribuído da consulta espaço textual top-k
spellingShingle Processamento distribuído da consulta espaço textual top-k
Novaes, Tiago Fernandes de Athayde
Particionamento de dados
Processamento de consultas distribuídas
Consultas espaço-textuais
Sistemas de informação
Recuperação de informação
Data partitioning
Distributed query processing
Spatio-textual query
Information systems
Information retrieval
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Processamento distribuído da consulta espaço textual top-k
title_full Processamento distribuído da consulta espaço textual top-k
title_fullStr Processamento distribuído da consulta espaço textual top-k
title_full_unstemmed Processamento distribuído da consulta espaço textual top-k
title_sort Processamento distribuído da consulta espaço textual top-k
author Novaes, Tiago Fernandes de Athayde
author_facet Novaes, Tiago Fernandes de Athayde
author_role author
dc.contributor.advisor1.fl_str_mv Rocha Junior, João Batista
dc.contributor.advisor1ID.fl_str_mv 02778818464
dc.contributor.authorID.fl_str_mv 00553970500
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5741698898011472
dc.contributor.author.fl_str_mv Novaes, Tiago Fernandes de Athayde
contributor_str_mv Rocha Junior, João Batista
dc.subject.por.fl_str_mv Particionamento de dados
Processamento de consultas distribuídas
Consultas espaço-textuais
Sistemas de informação
Recuperação de informação
topic Particionamento de dados
Processamento de consultas distribuídas
Consultas espaço-textuais
Sistemas de informação
Recuperação de informação
Data partitioning
Distributed query processing
Spatio-textual query
Information systems
Information retrieval
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Data partitioning
Distributed query processing
Spatio-textual query
Information systems
Information retrieval
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-11-28T21:38:06Z
dc.date.issued.fl_str_mv 2017-07-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017.
dc.identifier.uri.fl_str_mv http://localhost:8080/tede/handle/tede/530
identifier_str_mv NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017.
url http://localhost:8080/tede/handle/tede/530
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 3553627358684095092
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv 7994740082289590807
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual de Feira de Santana
dc.publisher.program.fl_str_mv Mestrado em Computação Aplicada
dc.publisher.initials.fl_str_mv UEFS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE CIÊNCIAS EXATAS
publisher.none.fl_str_mv Universidade Estadual de Feira de Santana
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEFS
instname:Universidade Estadual de Feira de Santana (UEFS)
instacron:UEFS
instname_str Universidade Estadual de Feira de Santana (UEFS)
instacron_str UEFS
institution UEFS
reponame_str Biblioteca Digital de Teses e Dissertações da UEFS
collection Biblioteca Digital de Teses e Dissertações da UEFS
bitstream.url.fl_str_mv http://tede2.uefs.br:8080/bitstream/tede/530/2/dissertacao-versao-final.pdf
http://tede2.uefs.br:8080/bitstream/tede/530/1/license.txt
bitstream.checksum.fl_str_mv a1476bba65482b40daa1a139191ea912
bd3efa91386c1718a7f26a329fdcb468
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)
repository.mail.fl_str_mv bcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.br
_version_ 1809288772803624960