Processamento eficiente de padrões de composição geométrica em grandes volumes de dados

Detalhes bibliográficos
Autor(a) principal: Khatibi, Amir Hassan Moghadam
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações do LNCC
Texto Completo: https://tede.lncc.br/handle/tede/284
Resumo: Big data processing is expected to empower decision-making as more infor- mation becomes accessible to analytical tools. In this work, we argue that the data deluge produced by the Big Data phenomenon blurs, amongst billions of dataset elements, high-level objects that can only be perceived once adequate composition models are in place. We argue that identifying such objects is relevant for various disciplines and we focus on Geometric Composition model using an example in astronomy. This work formulates the problem of Efficiently Computing Geometric Composition Patterns in Big Data (GCP). We present a novel technique with some pruning strategies to find these objects while we show the robustness and efficiency of our technique using a SPARK implementation over Hadoop parallel architecture.
id LNCC_52504dd415906d62f0c80b8519e82afa
oai_identifier_str oai:tede-server.lncc.br:tede/284
network_acronym_str LNCC
network_name_str Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling Porto, Fábio André MachadoPorto, Fábio André MachadoOgasawara, EduardoLopes, Hélio Côrtes VieiraZiviani, Arturhttp://lattes.cnpq.br/0086914917522589Khatibi, Amir Hassan Moghadam2023-02-17T13:11:10Z2016-02-29KHATIBI, A. Processamento eficiente de padrões de composição geométrica em grandes volumes de dados. 2016. 69 f. Dissertação (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2016.https://tede.lncc.br/handle/tede/284Big data processing is expected to empower decision-making as more infor- mation becomes accessible to analytical tools. In this work, we argue that the data deluge produced by the Big Data phenomenon blurs, amongst billions of dataset elements, high-level objects that can only be perceived once adequate composition models are in place. We argue that identifying such objects is relevant for various disciplines and we focus on Geometric Composition model using an example in astronomy. This work formulates the problem of Efficiently Computing Geometric Composition Patterns in Big Data (GCP). We present a novel technique with some pruning strategies to find these objects while we show the robustness and efficiency of our technique using a SPARK implementation over Hadoop parallel architecture.A partir do fenômeno do dilúvio de dados, o processamento de grandes volumes de dados (Big Data) passou a ser uma atividade mandatória na potencialização do processo de tomada de decisões baseadas em ferramentas analíticas. Neste trabalho, argumentamos que o caos de dados produzido pelo fenômeno Big Data esconde, entre bilhões de elementos de conjunto de dados, objetos de alto nível que só podem ser reconhecidos uma vez que modelos de composição adequados são aplicados. A identificação de tais objetos é relevante em várias disciplinas e apresentamos um estudo de caso na astronomia. Neste trabalho formulamos o problema de Processar Eficiente de Padrões de Composição Geométrica em Big Data. Apresentamos uma nova técnica com algumas estratégias de poda para encontrar estes objetos, enquanto mostramos a robustez e eficiência da técnica proposta usando uma implementação do SPARK sobre a arquitetura paralela do Hadoop.Submitted by Parícia Vieira Silva (library@lncc.br) on 2023-02-17T12:54:12Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) AmirKhatibi_Dissertacao_versao_final.pdf: 1782072 bytes, checksum: 64b45d6f143ab1c6d4be740ec5c314e7 (MD5)Approved for entry into archive by Parícia Vieira Silva (library@lncc.br) on 2023-02-17T13:00:35Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) AmirKhatibi_Dissertacao_versao_final.pdf: 1782072 bytes, checksum: 64b45d6f143ab1c6d4be740ec5c314e7 (MD5)Made available in DSpace on 2023-02-17T13:11:10Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) AmirKhatibi_Dissertacao_versao_final.pdf: 1782072 bytes, checksum: 64b45d6f143ab1c6d4be740ec5c314e7 (MD5) Previous issue date: 2018-08-27Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfhttp://tede-server.lncc.br:8080/retrieve/988/AmirKhatibi_Dissertacao_versao_final.pdf.jpgporLaboratório Nacional de Computação CientíficaPrograma de Pós-Graduação em Modelagem ComputacionalLNCCBrasilCoordenação de Pós-Graduação e Aperfeiçoamento (COPGA)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessBig dataIndexação espacialAmostragemProcessamento eficienteProcessamento paraleloCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSProcessamento eficiente de padrões de composição geométrica em grandes volumes de dadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCCLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://tede-server.lncc.br:8080/tede/bitstream/tede/284/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://tede-server.lncc.br:8080/tede/bitstream/tede/284/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80http://tede-server.lncc.br:8080/tede/bitstream/tede/284/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://tede-server.lncc.br:8080/tede/bitstream/tede/284/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALAmirKhatibi_Dissertacao_versao_final.pdfAmirKhatibi_Dissertacao_versao_final.pdfapplication/pdf1782072http://tede-server.lncc.br:8080/tede/bitstream/tede/284/5/AmirKhatibi_Dissertacao_versao_final.pdf64b45d6f143ab1c6d4be740ec5c314e7MD55TEXTAmirKhatibi_Dissertacao_versao_final.pdf.txtAmirKhatibi_Dissertacao_versao_final.pdf.txttext/plain112131http://tede-server.lncc.br:8080/tede/bitstream/tede/284/6/AmirKhatibi_Dissertacao_versao_final.pdf.txt9232596bda997fd37d1d55a79544fdc4MD56THUMBNAILAmirKhatibi_Dissertacao_versao_final.pdf.jpgAmirKhatibi_Dissertacao_versao_final.pdf.jpgimage/jpeg3095http://tede-server.lncc.br:8080/tede/bitstream/tede/284/7/AmirKhatibi_Dissertacao_versao_final.pdf.jpg61d2ba2ec691bdd2f3a11f2983a16f60MD57tede/2842023-06-05 11:33:45.451oai:tede-server.lncc.br:tede/284Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br||library@lncc.bropendoar:2023-06-05T14:33:45Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.por.fl_str_mv Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
title Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
spellingShingle Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
Khatibi, Amir Hassan Moghadam
Big data
Indexação espacial
Amostragem
Processamento eficiente
Processamento paralelo
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
title_short Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
title_full Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
title_fullStr Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
title_full_unstemmed Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
title_sort Processamento eficiente de padrões de composição geométrica em grandes volumes de dados
author Khatibi, Amir Hassan Moghadam
author_facet Khatibi, Amir Hassan Moghadam
author_role author
dc.contributor.advisor1.fl_str_mv Porto, Fábio André Machado
dc.contributor.referee1.fl_str_mv Porto, Fábio André Machado
dc.contributor.referee2.fl_str_mv Ogasawara, Eduardo
dc.contributor.referee3.fl_str_mv Lopes, Hélio Côrtes Vieira
dc.contributor.referee4.fl_str_mv Ziviani, Artur
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0086914917522589
dc.contributor.author.fl_str_mv Khatibi, Amir Hassan Moghadam
contributor_str_mv Porto, Fábio André Machado
Porto, Fábio André Machado
Ogasawara, Eduardo
Lopes, Hélio Côrtes Vieira
Ziviani, Artur
dc.subject.por.fl_str_mv Big data
Indexação espacial
Amostragem
Processamento eficiente
Processamento paralelo
topic Big data
Indexação espacial
Amostragem
Processamento eficiente
Processamento paralelo
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
description Big data processing is expected to empower decision-making as more infor- mation becomes accessible to analytical tools. In this work, we argue that the data deluge produced by the Big Data phenomenon blurs, amongst billions of dataset elements, high-level objects that can only be perceived once adequate composition models are in place. We argue that identifying such objects is relevant for various disciplines and we focus on Geometric Composition model using an example in astronomy. This work formulates the problem of Efficiently Computing Geometric Composition Patterns in Big Data (GCP). We present a novel technique with some pruning strategies to find these objects while we show the robustness and efficiency of our technique using a SPARK implementation over Hadoop parallel architecture.
publishDate 2016
dc.date.issued.fl_str_mv 2016-02-29
dc.date.accessioned.fl_str_mv 2023-02-17T13:11:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv KHATIBI, A. Processamento eficiente de padrões de composição geométrica em grandes volumes de dados. 2016. 69 f. Dissertação (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2016.
dc.identifier.uri.fl_str_mv https://tede.lncc.br/handle/tede/284
identifier_str_mv KHATIBI, A. Processamento eficiente de padrões de composição geométrica em grandes volumes de dados. 2016. 69 f. Dissertação (Programa de Pós-Graduação em Modelagem Computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2016.
url https://tede.lncc.br/handle/tede/284
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Modelagem Computacional
dc.publisher.initials.fl_str_mv LNCC
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
publisher.none.fl_str_mv Laboratório Nacional de Computação Científica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do LNCC
instname:Laboratório Nacional de Computação Científica (LNCC)
instacron:LNCC
instname_str Laboratório Nacional de Computação Científica (LNCC)
instacron_str LNCC
institution LNCC
reponame_str Biblioteca Digital de Teses e Dissertações do LNCC
collection Biblioteca Digital de Teses e Dissertações do LNCC
bitstream.url.fl_str_mv http://tede-server.lncc.br:8080/tede/bitstream/tede/284/1/license.txt
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/2/license_url
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/3/license_text
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/4/license_rdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/5/AmirKhatibi_Dissertacao_versao_final.pdf
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/6/AmirKhatibi_Dissertacao_versao_final.pdf.txt
http://tede-server.lncc.br:8080/tede/bitstream/tede/284/7/AmirKhatibi_Dissertacao_versao_final.pdf.jpg
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
64b45d6f143ab1c6d4be740ec5c314e7
9232596bda997fd37d1d55a79544fdc4
61d2ba2ec691bdd2f3a11f2983a16f60
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv library@lncc.br||library@lncc.br
_version_ 1797683219141754880