Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal do Ceará (UFC) |
Texto Completo: | http://www.repositorio.ufc.br/handle/riufc/38718 |
Resumo: | Nowadays, the storage of large amounts of confidential data in cloud servers is a common practice, since such strategy allows to reduce costs and also increases data availability. However, in cloud computing environment, data control is no longer owned by its legitimated user, becoming a storage service provider responsability. Such scenario gives rise to new challenges related to privacy, security and confidentiality. At this context, different solutions have been proposed for ensuring the confidentiality of the cloud stored data. In generall, such approaches are based on cryptography, data fragmentation or a combination of these two methodologies. Recently, a new approach, denoted QSM-EXTRACTION, has been proposed. The QSM-EXTRACTION strategy is based on the fragmentation of a digital file into fragments named information objects, on the decomposition of these objects through the extraction of some features and on the dispersion of these features in different cloud storage services. However, despite being developed for cloud computing environment, QSM-EXTRACTION method adopts a centralized execution approach, which may compromise the performance of the decomposition step. At the present work, we propose a paralell and distributed version of the QSM-EXTRACTION strategy, named pdQSM-EXTRACTION, which exploits the MapReduce paradigm aiming to provide a higher efficiency for the process of extracting features from information objects. The pdQSM-EXTRACTION approach has been implemented in Scala language programming, using Apache Spark framework. Several computing experiments and simulations have been performed aiming to evaluate the proposed approach. The obtained results, considering file sizes greater than or equal to 4GB, show that pdQSM-EXTRACTION strategy presents better performance than the one obtained by the QSM-EXTRACTION strategy, evaluated by computing the input time, defined as the total time spent to decompose a given file generating three other files containing the characteristics of quality, quantity and measurement. Thus, considering the processing of files whose sizes are greater than or equal to 4GB and the addition of one or more slave nodes by the pdQSM-EXTRACTION strategy, the ratio between the input time obtained by the pdQSM-EXTRACTION strategy and the input time obtained by the QSM-EXTRACTION strategy presented minimum and maximum values respectively of 53.57 % and 95.83 %. Therefore, we achieve to demonstrate the feasibility of pdQSM-EXTRACTION approach for applications involving large data volumes. |
id |
UFC-7_be48308b2ccf2034aaa5da9bea2cf4be |
---|---|
oai_identifier_str |
oai:repositorio.ufc.br:riufc/38718 |
network_acronym_str |
UFC-7 |
network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository_id_str |
|
spelling |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvemA parallel and distributed strategy to ascertain the confidentiality of data stored in the cloudPrivacidadeConfidencialidadeComputação em nuvemNowadays, the storage of large amounts of confidential data in cloud servers is a common practice, since such strategy allows to reduce costs and also increases data availability. However, in cloud computing environment, data control is no longer owned by its legitimated user, becoming a storage service provider responsability. Such scenario gives rise to new challenges related to privacy, security and confidentiality. At this context, different solutions have been proposed for ensuring the confidentiality of the cloud stored data. In generall, such approaches are based on cryptography, data fragmentation or a combination of these two methodologies. Recently, a new approach, denoted QSM-EXTRACTION, has been proposed. The QSM-EXTRACTION strategy is based on the fragmentation of a digital file into fragments named information objects, on the decomposition of these objects through the extraction of some features and on the dispersion of these features in different cloud storage services. However, despite being developed for cloud computing environment, QSM-EXTRACTION method adopts a centralized execution approach, which may compromise the performance of the decomposition step. At the present work, we propose a paralell and distributed version of the QSM-EXTRACTION strategy, named pdQSM-EXTRACTION, which exploits the MapReduce paradigm aiming to provide a higher efficiency for the process of extracting features from information objects. The pdQSM-EXTRACTION approach has been implemented in Scala language programming, using Apache Spark framework. Several computing experiments and simulations have been performed aiming to evaluate the proposed approach. The obtained results, considering file sizes greater than or equal to 4GB, show that pdQSM-EXTRACTION strategy presents better performance than the one obtained by the QSM-EXTRACTION strategy, evaluated by computing the input time, defined as the total time spent to decompose a given file generating three other files containing the characteristics of quality, quantity and measurement. Thus, considering the processing of files whose sizes are greater than or equal to 4GB and the addition of one or more slave nodes by the pdQSM-EXTRACTION strategy, the ratio between the input time obtained by the pdQSM-EXTRACTION strategy and the input time obtained by the QSM-EXTRACTION strategy presented minimum and maximum values respectively of 53.57 % and 95.83 %. Therefore, we achieve to demonstrate the feasibility of pdQSM-EXTRACTION approach for applications involving large data volumes.Atualmente, o armazenamento de grandes quantidades de dados confidenciais em servidores na nuvem é uma prática comum, uma vez que permite reduzir custos e aumentar a disponibilidade desses dados. Porém, nos ambientes de computação em nuvem, o controle dos dados deixa de ser do seu proprietário e passa a ser do provedor do serviço de armazenamento, o que faz surgir novos desafios relacionados à privacidade, segurança e confidencialidade. Neste contexto, diferentes soluções para assegurar a confidencialidade dos dados armazenados na nuvem foram propostas. Em geral, tais estratégias utilizam criptografia, fragmentação de dados ou uma combinação dessas duas abordagens. Recentemente, uma nova solução, denominada QSM-EXTRACTION, foi proposta. A estratégia QSM-EXTRACTION baseia-se na fragmentação de um arquivo digital em fragmentos denominados objetos de informação, na decomposição desses objetos por meio da extração de suas características e na dispersão dessas características em diferentes serviços de armazenamento em nuvem. Contudo, apesar de ter sido concebida para o ambiente de computação em nuvem, a QSM-EXTRACTION adota uma abordagem de execução centralizada, o que pode comprometer o desempenho da etapa de decomposição. Neste trabalho, propomos uma versão paralela e distribuída da estratégia QSM-EXTRACTION, denominada pdQSM-EXTRACTION, a qual explora o paradigma MapReduce com a finalidade de possibilitar uma maior eficiência no processo de extração das características dos objetos de informação. A abordagem pdQSM-EXTRACTION foi implementada em linguagem Scala utilizando-se o framework Apache Spark. Diversos experimentos foram realizados para avaliar a estratégia proposta. Os resultados obtidos demonstram que para arquivos com tamanhos maiores ou iguais a 4GB, a estratégia pdQSM-EXTRACTION apresenta desempenho melhor que o obtido pela estratégia QSM-EXTRACTION, avaliado pelo cálculo do tempo de entrada, definido como o tempo total gasto para decompor um dado arquivo gerando-se outros três arquivos contendo as características de qualidade, quantidade e medida. Assim, considerando-se o processamento de arquivos com tamanhos maiores ou iguais a 4GB e a adição de um ou mais nós escravos pela estratégia pdQSM-EXTRACTION, a razão entre o tempo de entrada obtido pela estratégia pdQSM-EXTRACTION e o tempo de entrada obtido pela estratégia QSM-EXTRACTION apresentou valores mínimos e máximos respectivamente de 53,57% e 95,83%. Portanto, comprova-se viabilidade da utilização da abordagem pdQSM-EXTRACTION em aplicações envolvendo grandes volumes de dados.Monteiro Filho, José Maria da SilvaMadeiro, João Paulo do ValeDantas, Lucas Moura2019-01-08T16:25:27Z2019-01-08T16:25:27Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfDANTAS, Lucas Moura. Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem. 2017. 140 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2017.http://www.repositorio.ufc.br/handle/riufc/38718porreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccess2020-06-29T19:24:39Zoai:repositorio.ufc.br:riufc/38718Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-09-11T18:21:15.048794Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
dc.title.none.fl_str_mv |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem A parallel and distributed strategy to ascertain the confidentiality of data stored in the cloud |
title |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
spellingShingle |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem Dantas, Lucas Moura Privacidade Confidencialidade Computação em nuvem |
title_short |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
title_full |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
title_fullStr |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
title_full_unstemmed |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
title_sort |
Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem |
author |
Dantas, Lucas Moura |
author_facet |
Dantas, Lucas Moura |
author_role |
author |
dc.contributor.none.fl_str_mv |
Monteiro Filho, José Maria da Silva Madeiro, João Paulo do Vale |
dc.contributor.author.fl_str_mv |
Dantas, Lucas Moura |
dc.subject.por.fl_str_mv |
Privacidade Confidencialidade Computação em nuvem |
topic |
Privacidade Confidencialidade Computação em nuvem |
description |
Nowadays, the storage of large amounts of confidential data in cloud servers is a common practice, since such strategy allows to reduce costs and also increases data availability. However, in cloud computing environment, data control is no longer owned by its legitimated user, becoming a storage service provider responsability. Such scenario gives rise to new challenges related to privacy, security and confidentiality. At this context, different solutions have been proposed for ensuring the confidentiality of the cloud stored data. In generall, such approaches are based on cryptography, data fragmentation or a combination of these two methodologies. Recently, a new approach, denoted QSM-EXTRACTION, has been proposed. The QSM-EXTRACTION strategy is based on the fragmentation of a digital file into fragments named information objects, on the decomposition of these objects through the extraction of some features and on the dispersion of these features in different cloud storage services. However, despite being developed for cloud computing environment, QSM-EXTRACTION method adopts a centralized execution approach, which may compromise the performance of the decomposition step. At the present work, we propose a paralell and distributed version of the QSM-EXTRACTION strategy, named pdQSM-EXTRACTION, which exploits the MapReduce paradigm aiming to provide a higher efficiency for the process of extracting features from information objects. The pdQSM-EXTRACTION approach has been implemented in Scala language programming, using Apache Spark framework. Several computing experiments and simulations have been performed aiming to evaluate the proposed approach. The obtained results, considering file sizes greater than or equal to 4GB, show that pdQSM-EXTRACTION strategy presents better performance than the one obtained by the QSM-EXTRACTION strategy, evaluated by computing the input time, defined as the total time spent to decompose a given file generating three other files containing the characteristics of quality, quantity and measurement. Thus, considering the processing of files whose sizes are greater than or equal to 4GB and the addition of one or more slave nodes by the pdQSM-EXTRACTION strategy, the ratio between the input time obtained by the pdQSM-EXTRACTION strategy and the input time obtained by the QSM-EXTRACTION strategy presented minimum and maximum values respectively of 53.57 % and 95.83 %. Therefore, we achieve to demonstrate the feasibility of pdQSM-EXTRACTION approach for applications involving large data volumes. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 2019-01-08T16:25:27Z 2019-01-08T16:25:27Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
DANTAS, Lucas Moura. Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem. 2017. 140 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2017. http://www.repositorio.ufc.br/handle/riufc/38718 |
identifier_str_mv |
DANTAS, Lucas Moura. Uma estratégia paralela e distribuída para assegurar a confidencialidade de dados armazenados em nuvem. 2017. 140 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2017. |
url |
http://www.repositorio.ufc.br/handle/riufc/38718 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
instname_str |
Universidade Federal do Ceará (UFC) |
instacron_str |
UFC |
institution |
UFC |
reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
_version_ |
1813028768598458368 |