Técnicas de encriptação e anonimização para Big Data

Detalhes bibliográficos
Autor(a) principal: Marques, David Miguel Coutinho
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/24147
Resumo: O objetivo desta dissertação é investigar várias estratégias que podem ser utilizadas para encriptar e ocultar as identidades em grandes dados (Big Data). Uma vez que os sistemas de Big Data estão a tornar-se mais predominantes numa vasta gama de indústrias, a proteção da confidencialidade dos dados sensíveis tem surgido como uma das preocupações mais prementes nos dias de hoje. A encriptação e a anonimização de dados são duas formas típicas utilizadas para preservar a privacidade dos dados em contextos que fazem uso intensivo de Big Data. Esta dissertação começa com uma visão exaustiva e análise detalhada dos diferentes métodos de encriptação e de anonimização que são amplamente utilizados na área de Big Data. Nesta visão geral, tanto os métodos clássicos de encriptação como a encriptação simétrica e assimétrica, assim como as estratégias modernas de encriptação como a encriptação homomorphic e a encriptação baseada em atributos, são discutidos em detalhe. De forma semelhante, uma grande variedade de estratégias de anonimização, tais como k-anonymity, l-diversity, e t-closeness, são examinadas em pormenor. Após a conclusão da avaliação, estas estratégias de encriptação e anonimização são analisa das e contrastadas, tendo em consideração os seus benefícios, inconvenientes e aplicabilidade a uma variedade de situações de Big Data. No decurso da investigação, são considerados fatores como a sobrecarga computacional, a utilidade dos dados, e a resistência ao ataque. Além disso, a dissertação contém uma secção prática na qual as técnicas de encriptação e de anonimização escolhidas são implementadas e avaliadas num conjunto de dados de Big Data. A avaliação inclui métricas de desempenho tais como tempo de encriptação/desencriptação de dados, perda de dados durante a anonimização, e a capacidade da anonimização para preservar a utilidade dos dados. Os resultados desta dissertação contribuem para um melhor conhecimento das estratégias de encriptação e anonimização de Big Data, e também dão aos investigadores e profissionais informações sobre como escolher as abordagens mais adequadas para proteger dados sensí veis em ambientes que utilizam de Big Data. Ao considerar estratégias de encriptação e de anonimização para uma variedade de casos de utilizam Big Data, os resultados ressaltam a importância de encontrar um equilíbrio adequado entre a proteção de dados e o seu potencial uso.
id RCAP_63b1f2e413eab5146ad767caae7e7034
oai_identifier_str oai:recipp.ipp.pt:10400.22/24147
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Técnicas de encriptação e anonimização para Big DataEncryption and anonymisation techniques for Big DataBig DataData encryptionNetwork securityData encryptionDomínio/Área Científica::Engenharia e TecnologiaO objetivo desta dissertação é investigar várias estratégias que podem ser utilizadas para encriptar e ocultar as identidades em grandes dados (Big Data). Uma vez que os sistemas de Big Data estão a tornar-se mais predominantes numa vasta gama de indústrias, a proteção da confidencialidade dos dados sensíveis tem surgido como uma das preocupações mais prementes nos dias de hoje. A encriptação e a anonimização de dados são duas formas típicas utilizadas para preservar a privacidade dos dados em contextos que fazem uso intensivo de Big Data. Esta dissertação começa com uma visão exaustiva e análise detalhada dos diferentes métodos de encriptação e de anonimização que são amplamente utilizados na área de Big Data. Nesta visão geral, tanto os métodos clássicos de encriptação como a encriptação simétrica e assimétrica, assim como as estratégias modernas de encriptação como a encriptação homomorphic e a encriptação baseada em atributos, são discutidos em detalhe. De forma semelhante, uma grande variedade de estratégias de anonimização, tais como k-anonymity, l-diversity, e t-closeness, são examinadas em pormenor. Após a conclusão da avaliação, estas estratégias de encriptação e anonimização são analisa das e contrastadas, tendo em consideração os seus benefícios, inconvenientes e aplicabilidade a uma variedade de situações de Big Data. No decurso da investigação, são considerados fatores como a sobrecarga computacional, a utilidade dos dados, e a resistência ao ataque. Além disso, a dissertação contém uma secção prática na qual as técnicas de encriptação e de anonimização escolhidas são implementadas e avaliadas num conjunto de dados de Big Data. A avaliação inclui métricas de desempenho tais como tempo de encriptação/desencriptação de dados, perda de dados durante a anonimização, e a capacidade da anonimização para preservar a utilidade dos dados. Os resultados desta dissertação contribuem para um melhor conhecimento das estratégias de encriptação e anonimização de Big Data, e também dão aos investigadores e profissionais informações sobre como escolher as abordagens mais adequadas para proteger dados sensí veis em ambientes que utilizam de Big Data. Ao considerar estratégias de encriptação e de anonimização para uma variedade de casos de utilizam Big Data, os resultados ressaltam a importância de encontrar um equilíbrio adequado entre a proteção de dados e o seu potencial uso.The aim of this thesis is to investigate various strategies that can be used to encrypt and hide the identities of Big Data. As Big Data systems are becoming more prevalent in a wide range of industries, protecting the confidentiality of sensitive data has emerged as one of the most pressing concerns today. Data encryption and Data anonymisation are two typical ways used to preserve data privacy in contexts that make intensive use of Big Data. This thesis starts with an exhaustive overview and detailed analysis of the different encryption and anonymization methods that are widely used in the area of Big Data. In this overview, both classical encryption methods like symmetric and asymmetric encryption, as well as modern encryption strategies like homographic encryption and attribute-based encryption are discussed in detail. Similarly, a wide variety of anonymization strategies, such as k anonymity, l-diversity, and t-closeness, are examined in detail. Upon completion of the evaluation, these encryption and anonymisation strategies are analy sed and contrasted, taking into consideration their benefits, drawbacks and applicability to a variety of Big Data situations. The research takes into account factors such as computa tional overhead, data utility and resistance to attack. In addition, the thesis includes a practical part where the chosen encryption and anony misation techniques are implemented and evaluated on a set of big data. The evaluation includes performance metrics such as data encryption/decryption time, data loss during anonymisation, and the ability of anonymisation to preserve data utility. The results of this dissertation contribute to a better understanding of Big Data encryption and anonymisation strategies, and also provide researchers and practitioners with information on how to choose the most appropriate approaches to protect sensitive data in environments using Big Data. By considering encryption and anonymisation strategies for a variety of Big Data use cases, the results highlight how critical it is to find a healthy balance between data protection and potential use.Pereira, Ana Maria Dias MadureiraRepositório Científico do Instituto Politécnico do PortoMarques, David Miguel Coutinho2023-11-132025-11-13T00:00:00Z2023-11-13T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/24147TID:203413300porinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-20T01:56:24Zoai:recipp.ipp.pt:10400.22/24147Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T00:42:21.848070Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Técnicas de encriptação e anonimização para Big Data
Encryption and anonymisation techniques for Big Data
title Técnicas de encriptação e anonimização para Big Data
spellingShingle Técnicas de encriptação e anonimização para Big Data
Marques, David Miguel Coutinho
Big Data
Data encryption
Network security
Data encryption
Domínio/Área Científica::Engenharia e Tecnologia
title_short Técnicas de encriptação e anonimização para Big Data
title_full Técnicas de encriptação e anonimização para Big Data
title_fullStr Técnicas de encriptação e anonimização para Big Data
title_full_unstemmed Técnicas de encriptação e anonimização para Big Data
title_sort Técnicas de encriptação e anonimização para Big Data
author Marques, David Miguel Coutinho
author_facet Marques, David Miguel Coutinho
author_role author
dc.contributor.none.fl_str_mv Pereira, Ana Maria Dias Madureira
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Marques, David Miguel Coutinho
dc.subject.por.fl_str_mv Big Data
Data encryption
Network security
Data encryption
Domínio/Área Científica::Engenharia e Tecnologia
topic Big Data
Data encryption
Network security
Data encryption
Domínio/Área Científica::Engenharia e Tecnologia
description O objetivo desta dissertação é investigar várias estratégias que podem ser utilizadas para encriptar e ocultar as identidades em grandes dados (Big Data). Uma vez que os sistemas de Big Data estão a tornar-se mais predominantes numa vasta gama de indústrias, a proteção da confidencialidade dos dados sensíveis tem surgido como uma das preocupações mais prementes nos dias de hoje. A encriptação e a anonimização de dados são duas formas típicas utilizadas para preservar a privacidade dos dados em contextos que fazem uso intensivo de Big Data. Esta dissertação começa com uma visão exaustiva e análise detalhada dos diferentes métodos de encriptação e de anonimização que são amplamente utilizados na área de Big Data. Nesta visão geral, tanto os métodos clássicos de encriptação como a encriptação simétrica e assimétrica, assim como as estratégias modernas de encriptação como a encriptação homomorphic e a encriptação baseada em atributos, são discutidos em detalhe. De forma semelhante, uma grande variedade de estratégias de anonimização, tais como k-anonymity, l-diversity, e t-closeness, são examinadas em pormenor. Após a conclusão da avaliação, estas estratégias de encriptação e anonimização são analisa das e contrastadas, tendo em consideração os seus benefícios, inconvenientes e aplicabilidade a uma variedade de situações de Big Data. No decurso da investigação, são considerados fatores como a sobrecarga computacional, a utilidade dos dados, e a resistência ao ataque. Além disso, a dissertação contém uma secção prática na qual as técnicas de encriptação e de anonimização escolhidas são implementadas e avaliadas num conjunto de dados de Big Data. A avaliação inclui métricas de desempenho tais como tempo de encriptação/desencriptação de dados, perda de dados durante a anonimização, e a capacidade da anonimização para preservar a utilidade dos dados. Os resultados desta dissertação contribuem para um melhor conhecimento das estratégias de encriptação e anonimização de Big Data, e também dão aos investigadores e profissionais informações sobre como escolher as abordagens mais adequadas para proteger dados sensí veis em ambientes que utilizam de Big Data. Ao considerar estratégias de encriptação e de anonimização para uma variedade de casos de utilizam Big Data, os resultados ressaltam a importância de encontrar um equilíbrio adequado entre a proteção de dados e o seu potencial uso.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-13
2023-11-13T00:00:00Z
2025-11-13T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/24147
TID:203413300
url http://hdl.handle.net/10400.22/24147
identifier_str_mv TID:203413300
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136324943347712