S2Dedup: SGX-enabled secure deduplication system

Detalhes bibliográficos
Autor(a) principal: Miranda, Mariana Martins de Sá
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/84129
Resumo: Dissertação de mestrado integrado em Informatics Engineering
id RCAP_6c38d3ac2a390ddbd04349b972a19ee2
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/84129
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling S2Dedup: SGX-enabled secure deduplication systemDeduplicaçãoSegurançaArmazenamentoHardware confiávelSGXDeduplicationSecurityStorageTrusted hardwareEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Informatics EngineeringCom os atuais avanços tecnológicos, cada vez mais informação está a ser digitalizada, resultando assim num aumento exponencial nos dados guardados em formato digital. Este crescimento sem precedentes tem levantado preocupações acerca do espaço e custo dos sistemas de armazenamento, criando uma necessidade de explorar mecanismos que visem mitigar este problema. Uma estratégia que se foca neste problema é a técnica conhecida por deduplicação, que se baseia no facto que dados idênticos estão a ser gerados e armazenados repetidamente, resultando assim num consumo desnecessário de espaço de armazenamento em disco. Deste modo, a deduplicação propõe uma análise dos dados armazenados e, subsequentemente, a eliminação de cópias redundantes, economizando espaço e custos de armazenamento. Serviços como DropBox e Google Drive aplicam essa estratégia, contudo, o processamento de dados que pertencem a vários utilizadores fomenta preocupações de privacidade e segurança, especialmente quando este é realizado em fornecedores de serviços de armazenamentos terceiros. A abordagem tradicional para resolver estes problemas é os utilizadores enviarem os seus dados já cifrados. Contudo, usar uma cifra probabilística implica que dados idênticos podem resultar em textos cifrados diferentes, o que torna impossível encontrar copias redundantes e, consequentemente, aplicar a deduplicação. Deste modo, propomos o S2Dedup, um sistema de deduplicação seguro que explora tecnologias emergentes de segurança assistida por hardware. Mais especificamente, a solução proposta recorre ao Intel SGX (Software Guard Extensions), de forma a permitir a deduplicação de dados entre utilizadores em infraestruturas de armazenamento de terceiros, sem descuidar da segurança e privacidade dos seus dados. Além disto, o S2Dedup foi projetado para oferecer suporte a vários esquemas de segurança, cada um oferecendo diferentes níveis de espaço poupado, desempenho e privacidade. Esta característica é fundamental para garantir a aplicabilidade do S2Dedup a uma gama ampla de sistemas com requisitos diferentes. Um protótipo do S2Dedup é implementado e avaliado com cargas de trabalho sintéticas e realistas, assim como comparado com as soluções alternativas de deduplicação seguras do estado da arte. Os resultados mostram que é possível implementar técnicas de segurança mais robustas e ao mesmo tempo manter bons resultados de desempenho e até mesmo alcançar, em alguns casos, uma melhoria na eficácia da deduplicação em comparação com as soluções do estado da arte.With the current advancements in computer technologies, more and more information is being digitized, resulting in an exponential increase of digital data. This unprecedented growth raises concerns about the space and cost of data storage, creating the need to explore mechanisms that strive to mitigate this ever-increasing data problem. A strategy that addresses this issue is the technique known as deduplication, which lever ages from the fact that identical data is being generated and stored repeatedly, consuming unnecessary storage space. Therefore, deduplication proposes an analysis of the stored data and subsequently the elimination of redundant copies, thus saving storage space and costs. Services like DropBox and Google Drive support deduplication, however, eliminating redundant information across data belonging to multiple users raises privacy and security concerns, specially when this is done at third-party untrusted infrastructures. The con ventional approach to ensure data privacy is for the users to outsource their data in an encrypted format. However, using standard probabilistic encryption implies that identical data will result in different ciphertexts, which makes it impossible to find redundant copies, and consequently apply deduplication. Therefore we propose S2Dedup, a secure deduplication system that explores emergent hardware-assisted security technologies. In more detail, the proposed solution leverages Intel Software Guard Extensions to enable cross-user privacy-preserving deduplication at third-party storage infrastructures. Furthermore, S2Dedup is designed to support multiple security schemes, each providing different trade-offs in terms of deduplication space savings, storage performance, and privacy. Such feature is key to improve S2Dedup’s applicability to a wider range of applications with different requirements. A prototype of S2Dedup is implemented and evaluated with both synthetic and realistic workloads whilst being compared to the state of the art secure deduplication solutions. The results show that it is possible to implement more robust security techniques, while maintaining overall interesting performance results and even achieve, in some cases, an improvement of deduplication effectiveness when compared to the state of the art solutions.Paulo, João Tiago MedeirosOliveira, Rui Carlos Mendes deUniversidade do MinhoMiranda, Mariana Martins de Sá2020-12-142020-12-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/84129eng203254147info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:39:05Zoai:repositorium.sdum.uminho.pt:1822/84129Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:35:38.616272Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv S2Dedup: SGX-enabled secure deduplication system
title S2Dedup: SGX-enabled secure deduplication system
spellingShingle S2Dedup: SGX-enabled secure deduplication system
Miranda, Mariana Martins de Sá
Deduplicação
Segurança
Armazenamento
Hardware confiável
SGX
Deduplication
Security
Storage
Trusted hardware
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short S2Dedup: SGX-enabled secure deduplication system
title_full S2Dedup: SGX-enabled secure deduplication system
title_fullStr S2Dedup: SGX-enabled secure deduplication system
title_full_unstemmed S2Dedup: SGX-enabled secure deduplication system
title_sort S2Dedup: SGX-enabled secure deduplication system
author Miranda, Mariana Martins de Sá
author_facet Miranda, Mariana Martins de Sá
author_role author
dc.contributor.none.fl_str_mv Paulo, João Tiago Medeiros
Oliveira, Rui Carlos Mendes de
Universidade do Minho
dc.contributor.author.fl_str_mv Miranda, Mariana Martins de Sá
dc.subject.por.fl_str_mv Deduplicação
Segurança
Armazenamento
Hardware confiável
SGX
Deduplication
Security
Storage
Trusted hardware
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Deduplicação
Segurança
Armazenamento
Hardware confiável
SGX
Deduplication
Security
Storage
Trusted hardware
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado integrado em Informatics Engineering
publishDate 2020
dc.date.none.fl_str_mv 2020-12-14
2020-12-14T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/84129
url https://hdl.handle.net/1822/84129
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203254147
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132882721046528