Processamento distribuído da consulta espaço textual top-k
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UEFS |
Texto Completo: | http://localhost:8080/tede/handle/tede/530 |
Resumo: | With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets. |
id |
UEFS_5518fe6631342c8d5ec96177e743c4fe |
---|---|
oai_identifier_str |
oai:tede2.uefs.br:8080:tede/530 |
network_acronym_str |
UEFS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UEFS |
repository_id_str |
|
spelling |
Rocha Junior, João Batista0277881846400553970500http://lattes.cnpq.br/5741698898011472Novaes, Tiago Fernandes de Athayde2017-11-28T21:38:06Z2017-07-17NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017.http://localhost:8080/tede/handle/tede/530With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets.Com a popularização de bases de dados contendo objetos que possuem informação espacial e textual (objeto espaço-textual), aumentou o interesse por novas consultas e técnicas capazes de recuperar esses objetos de forma eficiente. Uma das principais consultas para objetos espaço-textuais é a consulta espaço-textual top-k. Essa consulta visa recuperar os k melhores objetos considerando a distância do objeto até um local informado na consulta e a similaridade textual entre palavras-chave de busca e a informação textual dos objetos. No entanto, a maioria dos estudos para consultas espaço-textual top-k assumem ambientes centralizados, não abordando problemas frequentes em aplicações do mundo real como escalabilidade. Nesta dissertação são estudadas diferentes formas de particionar os dados e o impacto destes particionamentos no processamento da consulta espaço-textual top-k em um ambiente distribuído. Todas as estratégias propostas são avaliadas em um ambiente distribuído real, utilizando dados reais.Submitted by Ricardo Cedraz Duque Moliterno (ricardo.moliterno@uefs.br) on 2017-11-28T21:38:06Z No. of bitstreams: 1 dissertacao-versao-final.pdf: 2717503 bytes, checksum: a1476bba65482b40daa1a139191ea912 (MD5)Made available in DSpace on 2017-11-28T21:38:06Z (GMT). No. of bitstreams: 1 dissertacao-versao-final.pdf: 2717503 bytes, checksum: a1476bba65482b40daa1a139191ea912 (MD5) Previous issue date: 2017-07-17application/pdfporUniversidade Estadual de Feira de SantanaMestrado em Computação AplicadaUEFSBrasilDEPARTAMENTO DE CIÊNCIAS EXATASParticionamento de dadosProcessamento de consultas distribuídasConsultas espaço-textuaisSistemas de informaçãoRecuperação de informaçãoData partitioningDistributed query processingSpatio-textual queryInformation systemsInformation retrievalCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProcessamento distribuído da consulta espaço textual top-kinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis355362735868409509260060060079947400822895908073671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UEFSinstname:Universidade Estadual de Feira de Santana (UEFS)instacron:UEFSORIGINALdissertacao-versao-final.pdfdissertacao-versao-final.pdfapplication/pdf2717503http://tede2.uefs.br:8080/bitstream/tede/530/2/dissertacao-versao-final.pdfa1476bba65482b40daa1a139191ea912MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede2.uefs.br:8080/bitstream/tede/530/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/5302017-11-28 18:38:06.722oai:tede2.uefs.br:8080:tede/530Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.uefs.br:8080/PUBhttp://tede2.uefs.br:8080/oai/requestbcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.bropendoar:2017-11-28T21:38:06Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS)false |
dc.title.por.fl_str_mv |
Processamento distribuído da consulta espaço textual top-k |
title |
Processamento distribuído da consulta espaço textual top-k |
spellingShingle |
Processamento distribuído da consulta espaço textual top-k Novaes, Tiago Fernandes de Athayde Particionamento de dados Processamento de consultas distribuídas Consultas espaço-textuais Sistemas de informação Recuperação de informação Data partitioning Distributed query processing Spatio-textual query Information systems Information retrieval CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Processamento distribuído da consulta espaço textual top-k |
title_full |
Processamento distribuído da consulta espaço textual top-k |
title_fullStr |
Processamento distribuído da consulta espaço textual top-k |
title_full_unstemmed |
Processamento distribuído da consulta espaço textual top-k |
title_sort |
Processamento distribuído da consulta espaço textual top-k |
author |
Novaes, Tiago Fernandes de Athayde |
author_facet |
Novaes, Tiago Fernandes de Athayde |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Rocha Junior, João Batista |
dc.contributor.advisor1ID.fl_str_mv |
02778818464 |
dc.contributor.authorID.fl_str_mv |
00553970500 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5741698898011472 |
dc.contributor.author.fl_str_mv |
Novaes, Tiago Fernandes de Athayde |
contributor_str_mv |
Rocha Junior, João Batista |
dc.subject.por.fl_str_mv |
Particionamento de dados Processamento de consultas distribuídas Consultas espaço-textuais Sistemas de informação Recuperação de informação |
topic |
Particionamento de dados Processamento de consultas distribuídas Consultas espaço-textuais Sistemas de informação Recuperação de informação Data partitioning Distributed query processing Spatio-textual query Information systems Information retrieval CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Data partitioning Distributed query processing Spatio-textual query Information systems Information retrieval |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
With the popularization of databases containing objects with spatial and textual information (spatio-textual object), the interest in new queries and techniques for retrieving these objects have increased. In this scenario, the main query is the the top-k spatio-textual query. This query retrieves the k best spatio-textual objects considering the distance of the object to the query location and the textual similarity between the query keywords and the textual information of the objects. However, most the studies related to top-k spatio-textual query are performed in centralized environments, not addressing real world problems such as scalability. In this paper, we study different strategies for partitioning the data and processing the top-k spatio-textual query in a distributed environment. We evaluate each strategy in a real distributed environment, employing real datasets. |
publishDate |
2017 |
dc.date.accessioned.fl_str_mv |
2017-11-28T21:38:06Z |
dc.date.issued.fl_str_mv |
2017-07-17 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017. |
dc.identifier.uri.fl_str_mv |
http://localhost:8080/tede/handle/tede/530 |
identifier_str_mv |
NOVAES, Tiago Fernandes de Athayde. Processamento distribuído da consulta espaço textual top-k. 2017. 64 f. Dissertação (Mestrado em Computação Aplicada)- Universidade Estadual de Feira de Santana, Feira de Santana, 2017. |
url |
http://localhost:8080/tede/handle/tede/530 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
3553627358684095092 |
dc.relation.confidence.fl_str_mv |
600 600 600 |
dc.relation.department.fl_str_mv |
7994740082289590807 |
dc.relation.cnpq.fl_str_mv |
3671711205811204509 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Feira de Santana |
dc.publisher.program.fl_str_mv |
Mestrado em Computação Aplicada |
dc.publisher.initials.fl_str_mv |
UEFS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE CIÊNCIAS EXATAS |
publisher.none.fl_str_mv |
Universidade Estadual de Feira de Santana |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UEFS instname:Universidade Estadual de Feira de Santana (UEFS) instacron:UEFS |
instname_str |
Universidade Estadual de Feira de Santana (UEFS) |
instacron_str |
UEFS |
institution |
UEFS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UEFS |
collection |
Biblioteca Digital de Teses e Dissertações da UEFS |
bitstream.url.fl_str_mv |
http://tede2.uefs.br:8080/bitstream/tede/530/2/dissertacao-versao-final.pdf http://tede2.uefs.br:8080/bitstream/tede/530/1/license.txt |
bitstream.checksum.fl_str_mv |
a1476bba65482b40daa1a139191ea912 bd3efa91386c1718a7f26a329fdcb468 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UEFS - Universidade Estadual de Feira de Santana (UEFS) |
repository.mail.fl_str_mv |
bcuefs@uefs.br|| bcref@uefs.br||bcuefs@uefs.br |
_version_ |
1809288772803624960 |