Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
Texto Completo: | https://www.repositorio.mar.mil.br/handle/ripcmb/846508 |
Resumo: | Os Sistemas Ciber-físicos, do inglês Cyber-Physical Systems (CPS), estão cada vez mais interligados aos sistemas críticos de infraestrutura que têm a capacidade de impactar a vida humana no nosso dia-a-dia. A segurança das informações digitais é de vital importância para estes sistemas, como, por exemplo, nas plantas industriais de tratamento de água ou nas malhas de energia elétrica Smart Grid (SG), onde um invasor pode prejudicar a distribuição dos recursos vitais ou de equipamentos elétricos, se as medidas de segurança necessárias não forem adotadas. Neste contexto, os Sistemas de Detecção de Intrusão, do inglês Intrusion Detection Systems (IDS), se fazem necessários como uma linha de defesa para esses sistemas tão importantes do nosso cotidiano. O uso de técnicas de Aprendizado de Máquina (AM) em IDS é importantes para a detecção de intrusões com o mínimo de intervenção humana. Neste contexto, as técnicas clássicas empregadas em um conjunto de dados (datasets) limitados e estáticos durante o aprendizado são conhecidas como AM Off-line. Porém, com a necessidade cada vez maior de utilizar os IDS em sistemas críticos em tempo real, surge a necessidade do uso de técnicas de aprendizado de máquina em fluxo de dados, conhecidas como AM Online. Nesta última técnica, cada amostra deverá passar uma única vez nas etapas de aprendizado e de teste, sem serem armazenadas permanentemente na memória, devido ao grande fluxo de dados. Muitos estudos na área de IDS em CPS não fazem uso adequado de datasets específicos da área, o que acaba por não representar uma relação direta com os equipamentos reais existentes nesses sistemas. Esta motivação levou a um levantamento dos principais datasets existentes na literatura referente a CPS, que serão posteriormente utilizados nos experimentos dessa dissertação. Logo, este trabalho tem o objetivo de analisar a detecção de invasões em sistemas ciber-físicos com estes datasets, com a utilização de métodos IDS com técnicas de Aprendizado de Máquina Off-line e Aprendizado de Máquina On-line. No final, é constatado que o AM Off-line apresenta as melhores métricas de classificação para detecção de ataques, enquanto o AM On-line tem melhor capacidade de adaptação na presença de novos ataques, com menor demanda de recursos de memória e processamento. |
id |
MB_953304f7bdd69ffca69452e2beb32bfe |
---|---|
oai_identifier_str |
oai:www.repositorio.mar.mil.br:ripcmb/846508 |
network_acronym_str |
MB |
network_name_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
repository_id_str |
|
spelling |
Santos, Vinícius Figueiredo dosAlbuquerque, Célio Vinicius Neves dePassos, Diego Gimenez2024-01-03T13:18:16Z2024-01-03T13:18:16Z2022https://www.repositorio.mar.mil.br/handle/ripcmb/846508Os Sistemas Ciber-físicos, do inglês Cyber-Physical Systems (CPS), estão cada vez mais interligados aos sistemas críticos de infraestrutura que têm a capacidade de impactar a vida humana no nosso dia-a-dia. A segurança das informações digitais é de vital importância para estes sistemas, como, por exemplo, nas plantas industriais de tratamento de água ou nas malhas de energia elétrica Smart Grid (SG), onde um invasor pode prejudicar a distribuição dos recursos vitais ou de equipamentos elétricos, se as medidas de segurança necessárias não forem adotadas. Neste contexto, os Sistemas de Detecção de Intrusão, do inglês Intrusion Detection Systems (IDS), se fazem necessários como uma linha de defesa para esses sistemas tão importantes do nosso cotidiano. O uso de técnicas de Aprendizado de Máquina (AM) em IDS é importantes para a detecção de intrusões com o mínimo de intervenção humana. Neste contexto, as técnicas clássicas empregadas em um conjunto de dados (datasets) limitados e estáticos durante o aprendizado são conhecidas como AM Off-line. Porém, com a necessidade cada vez maior de utilizar os IDS em sistemas críticos em tempo real, surge a necessidade do uso de técnicas de aprendizado de máquina em fluxo de dados, conhecidas como AM Online. Nesta última técnica, cada amostra deverá passar uma única vez nas etapas de aprendizado e de teste, sem serem armazenadas permanentemente na memória, devido ao grande fluxo de dados. Muitos estudos na área de IDS em CPS não fazem uso adequado de datasets específicos da área, o que acaba por não representar uma relação direta com os equipamentos reais existentes nesses sistemas. Esta motivação levou a um levantamento dos principais datasets existentes na literatura referente a CPS, que serão posteriormente utilizados nos experimentos dessa dissertação. Logo, este trabalho tem o objetivo de analisar a detecção de invasões em sistemas ciber-físicos com estes datasets, com a utilização de métodos IDS com técnicas de Aprendizado de Máquina Off-line e Aprendizado de Máquina On-line. No final, é constatado que o AM Off-line apresenta as melhores métricas de classificação para detecção de ataques, enquanto o AM On-line tem melhor capacidade de adaptação na presença de novos ataques, com menor demanda de recursos de memória e processamento.Cyber-Physical Systems (CPS) are increasingly interconnected to the most diverse critical infrastructure systems that can impact human life in our daily lives. The security of digital information is of vital importance for these systems, such as industrial water treatment plants or Smart Grid electrical grids, where an attack can harm a part of the distribution of vital resources or electrical equipment if the necessary security measures are not adopted. In this context, Intrusion Detection Systems (IDS) are needed as a second line of defense for these systems that are so important in our daily lives. The use of Machine Learning (ML) techniques in IDS is important as an automatic way to detect intrusions with minimal human intervention. In this context, machine learning techniques on standard datasets are known as Offline ML. However, with the increasing need to use IDS in Big Data with time constraints and limited memory, there is a need to use data flow machine learning techniques, which are known as Online ML. In this last technique, each sample must pass the learning and testing stages only once, without being stored in memory, due to the large flow of data. Many studies in the area of IDS in CPS do not make adequate use of specific datasets of the area representing the actual existing equipment of these systems. This motivation led to a survey of the main datasets existing in the literature referring to CPS that will be later used in the experiments of this dissertation. Therefore, this work aims to compare the intrusion detection in cyber-physical systems with these suitable datasets using IDS methods with Offline Machine Learning techniques and Online Machine Learning.Universidade Federal Fluminense (UFF)Ciência da computaçãoSistemas ciber-físicosSistemas de detecção de intrusãoAprendizado de máquina on-lineAprendizado de máquina off-lineDetecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MBORIGINALDissertacao-Vinicius-Figueiredo.pdfDissertacao-Vinicius-Figueiredo.pdfapplication/pdf1162057https://www.repositorio.mar.mil.br/bitstream/ripcmb/846508/1/Dissertacao-Vinicius-Figueiredo.pdf7c80da2b9a795b0f799f8df99a31c86bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-83272https://www.repositorio.mar.mil.br/bitstream/ripcmb/846508/2/license.txt8ff7ce654d5215cee2106f3e3b7eb37fMD52ripcmb/8465082024-01-03 11:44:11.037oai:www.repositorio.mar.mil.br:ripcmb/846508QW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCBvIFNyLiBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSAgIGNvbmNlZGUobSkgICDDoCAgIE1BUklOSEEgIERPICAgQlJBU0lMLCAgIGdlc3RvcmEgICBkYSAgUmVkZSAgIEJJTSAgIGUgICBkbyAgIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIE1hcmluaGEgZG8gQnJhc2lsIChSSS1NQiksIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCBjb252ZXJ0ZXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZGVwb3NpdGFkbyBlbSBmb3JtYXRvIGltcHJlc3NvLCBlbGV0csO0bmljbyBvdSBlbSBxdWFscXVlciBvdXRybyBtZWlvLiBPIFNyKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIE1BUklOSEEgRE8gQlJBU0lMLCBnZXN0b3JhIGRhIFJlZGUgQklNIGUgZG8gUkktTUIsIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCBjb252ZXJ0ZXIgbyBhcnF1aXZvIGRlcG9zaXRhZG8gYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4gTyAgU3IocykgIHRhbWLDqW0gIGNvbmNvcmRhKG0pICBxdWUgIGEgIE1BUklOSEEgIERPICBCUkFTSUwsICBnZXN0b3JhICBkYSAgUmVkZSAgQklNICBlICBkbyAgUkktTUIsICBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGVzdGUgZGVww7NzaXRvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUvb3UgcHJlc2VydmHDp8Ojby5PICBTcihzKSAgZGVjbGFyYShtKSAgcXVlICBhICBhcHJlc2VudGHDp8OjbyAgZG8gIHNldSAgdHJhYmFsaG8gIMOpICBvcmlnaW5hbCAgZSAgcXVlICBvICBTcihzKSAgcG9kZShtKSAgY29uY2VkZXIgIG9zICBkaXJlaXRvcyAgY29udGlkb3MgIG5lc3RhICBsaWNlbsOnYS4gIE8gIFNyKHMpICB0YW1iw6ltICBkZWNsYXJhKG0pICBxdWUgIG8gIGVudmlvICDDqSAgZGUgIHNldSAgY29uaGVjaW1lbnRvICBlICBuw6NvICBpbmZyaW5nZSAgb3MgIGRpcmVpdG9zICBhdXRvcmFpcyAgZGUgIG91dHJhICBwZXNzb2EgIG91ICBpbnN0aXR1acOnw6NvLiAgQ2FzbyAgbyAgZG9jdW1lbnRvICBhICBzZXIgIGRlcG9zaXRhZG8gIGNvbnRlbmhhICBtYXRlcmlhbCAgcGFyYSAgbyAgcXVhbCAgbyAgU3IocykgIG7Do28gIGRldMOpbSAgYSAgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBkZSBhdXRvcmFpcywgbyBTcihzKSBkZWNsYXJhKG0pIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgY29uY2VkZXIgw6AgTUFSSU5IQSBETyBCUkFTSUwsIGdlc3RvcmEgZGEgUmVkZSBCSU0gZSBkbyBSSS1NQiwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zLCBlc3TDo28gZGV2aWRhbWVudGUgaWRlbnRpZmljYWRvcyBlIHJlY29uaGVjaWRvcyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZGEgYXByZXNlbnRhw6fDo28uIENBU08gIE8gIFRSQUJBTEhPICBERVBPU0lUQURPICBURU5IQSAgU0lETyAgRklOQU5DSUFETyAgT1UgIEFQT0lBRE8gIFBPUiAgVU0gIMOTUkfDg08sICBRVUUgIE7Dg08gIEEgIElOU1RJVFVJw4fDg08gIERFU1RFICBSRVNQT1NJVMOTUklPOiAgTyAgU1IgIERFQ0xBUkEgIFRFUiAgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIFBFTE8gQ09OVFJBVE8gT1UgQUNPUkRPLk8gICAgU3IocykgICAgY29uY29yZGEobSkgICAgY29tICAgIGEgICAgTGljZW7Dp2EgICAgQ3JlYXRpdmUgICAgQ29tbW9ucyAgICBhZG90YWRhICAgIHBhcmEgICAgZXN0ZSAgICBSZXBvc2l0w7NyaW8gICAgSW5zdGl0dWNpb25hbCAgICBxdWUgICAgY29uY2VkZSAgICBvICAgIGRpcmVpdG8gICAgZGUgICAgQ09NUEFSVElMSEFSICAgIGUgICAgYXMgICAgcmVzdHJpw6fDtWVzICAgIGRlICAgIEFUUklCVUnDh8ODTywgICAgTsODTyAgICBDT01FUkNJQUxJWkHDh8ODTyAgICBFICAgIFNFTSAgICBERVJJVkHDh8OVRVMuQ09NUEFSVElMSEFSOiAgY29waWFyICBlICByZWRpc3RyaWJ1aXIgIG8gIG1hdGVyaWFsICBlbSAgcXVhbHF1ZXIgIHN1cG9ydGUgIG91ICBmb3JtYXRvICBlICBvICBsaWNlbmNpYW50ZSBuw6NvIHBvZGUgcmV2b2dhciBlc3RlcyBkaXJlaXRvcyBkZXNkZSBxdWUgbyBTcihzKSByZXNwZWl0ZShtKSBvcyB0ZXJtb3MgZGEgbGljZW7Dp2EuQVRSSUJVScOHw4NPOiAgbyAgU3IocykgIGRldmUobSkgIGRhciAgbyAgY3LDqWRpdG8gIGFwcm9wcmlhZG8sICBwcm92ZXIgIHVtICBsaW5rICBwYXJhICBhICBsaWNlbsOnYSAgZSAgaW5kaWNhciAgc2UgIG11ZGFuw6dhcyAgZm9yYW0gIGZlaXRhcy4gIE8gIFNyKHMpICBkZXZlKG0pICBmYXrDqi1sbyAgZW0gIHF1YWxxdWVyICBjaXJjdW5zdMOibmNpYSByYXpvw6F2ZWwsIG1hcyBkZSBtYW5laXJhIGFsZ3VtYSBxdWUgc3VnaXJhIGFvIGxpY2VuY2lhbnRlIGEgYXBvaWFyIG8gU3Iocykgb3UgbyBzZXUgdXNvLk7Dg08gQ09NRVJDSUFMOiBvIFNyKHMpIG7Do28gcG9kZShtKSB1c2FyIG8gbWF0ZXJpYWwgcGFyYSBmaW5zIGNvbWVyY2lhaXMuU0VNIERFUklWQcOHw5VFUzogc2UgbyBTcihzKSByZW1peGFyKGVtKSwgdHJhbnNmb3JtYXIoZW0pIG91IGNyaWFyKGVtKSBhIHBhcnRpciBkbyBtYXRlcmlhbCwgbyBTcihzKSBuw6NvIHBvZGUobSkgZGlzdHJpYnVpciBvIG1hdGVyaWFsIG1vZGlmaWNhZG8uU0VNIFJFU1RSScOHw5VFUyBBRElDSU9OQUlTOiBvIFNyKHMpIG7Do28gcG9kZShtKSBhcGxpY2FyIHRlcm1vcyBqdXLDrWRpY29zIG91IG1lZGlkYXMgZGUgY2Fyw6F0ZXIgdGVjbm9sw7NnaWNvIHF1ZSByZXN0cmluamFtIGxlZ2FsbWVudGUgb3V0cm9zIGRlIGZhemVyZW0gYWxnbyBxdWUgYSBsaWNlbsOnYSBwZXJtaXRhLkEgUmVkZSBCSU0gZSBvIFJJLU1CIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvIHNldShzKSBub21lKHMpIGNvbW8gYXV0b3IoZXMpIG91IHRpdHVsYXIoZXMpIGRvIGRpcmVpdG8gZGUgYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2024-01-03T14:44:11Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false |
dc.title.pt_BR.fl_str_mv |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
title |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
spellingShingle |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina Santos, Vinícius Figueiredo dos Sistemas ciber-físicos Sistemas de detecção de intrusão Aprendizado de máquina on-line Aprendizado de máquina off-line Ciência da computação |
title_short |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
title_full |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
title_fullStr |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
title_full_unstemmed |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
title_sort |
Detecção de intrusão em sistemas ciber-físicos com uso de técnicas de aprendizado de máquina |
author |
Santos, Vinícius Figueiredo dos |
author_facet |
Santos, Vinícius Figueiredo dos |
author_role |
author |
dc.contributor.author.fl_str_mv |
Santos, Vinícius Figueiredo dos |
dc.contributor.advisor1.fl_str_mv |
Albuquerque, Célio Vinicius Neves de Passos, Diego Gimenez |
contributor_str_mv |
Albuquerque, Célio Vinicius Neves de Passos, Diego Gimenez |
dc.subject.por.fl_str_mv |
Sistemas ciber-físicos Sistemas de detecção de intrusão Aprendizado de máquina on-line Aprendizado de máquina off-line |
topic |
Sistemas ciber-físicos Sistemas de detecção de intrusão Aprendizado de máquina on-line Aprendizado de máquina off-line Ciência da computação |
dc.subject.dgpm.pt_BR.fl_str_mv |
Ciência da computação |
description |
Os Sistemas Ciber-físicos, do inglês Cyber-Physical Systems (CPS), estão cada vez mais interligados aos sistemas críticos de infraestrutura que têm a capacidade de impactar a vida humana no nosso dia-a-dia. A segurança das informações digitais é de vital importância para estes sistemas, como, por exemplo, nas plantas industriais de tratamento de água ou nas malhas de energia elétrica Smart Grid (SG), onde um invasor pode prejudicar a distribuição dos recursos vitais ou de equipamentos elétricos, se as medidas de segurança necessárias não forem adotadas. Neste contexto, os Sistemas de Detecção de Intrusão, do inglês Intrusion Detection Systems (IDS), se fazem necessários como uma linha de defesa para esses sistemas tão importantes do nosso cotidiano. O uso de técnicas de Aprendizado de Máquina (AM) em IDS é importantes para a detecção de intrusões com o mínimo de intervenção humana. Neste contexto, as técnicas clássicas empregadas em um conjunto de dados (datasets) limitados e estáticos durante o aprendizado são conhecidas como AM Off-line. Porém, com a necessidade cada vez maior de utilizar os IDS em sistemas críticos em tempo real, surge a necessidade do uso de técnicas de aprendizado de máquina em fluxo de dados, conhecidas como AM Online. Nesta última técnica, cada amostra deverá passar uma única vez nas etapas de aprendizado e de teste, sem serem armazenadas permanentemente na memória, devido ao grande fluxo de dados. Muitos estudos na área de IDS em CPS não fazem uso adequado de datasets específicos da área, o que acaba por não representar uma relação direta com os equipamentos reais existentes nesses sistemas. Esta motivação levou a um levantamento dos principais datasets existentes na literatura referente a CPS, que serão posteriormente utilizados nos experimentos dessa dissertação. Logo, este trabalho tem o objetivo de analisar a detecção de invasões em sistemas ciber-físicos com estes datasets, com a utilização de métodos IDS com técnicas de Aprendizado de Máquina Off-line e Aprendizado de Máquina On-line. No final, é constatado que o AM Off-line apresenta as melhores métricas de classificação para detecção de ataques, enquanto o AM On-line tem melhor capacidade de adaptação na presença de novos ataques, com menor demanda de recursos de memória e processamento. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022 |
dc.date.accessioned.fl_str_mv |
2024-01-03T13:18:16Z |
dc.date.available.fl_str_mv |
2024-01-03T13:18:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.repositorio.mar.mil.br/handle/ripcmb/846508 |
url |
https://www.repositorio.mar.mil.br/handle/ripcmb/846508 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal Fluminense (UFF) |
publisher.none.fl_str_mv |
Universidade Federal Fluminense (UFF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) instname:Marinha do Brasil (MB) instacron:MB |
instname_str |
Marinha do Brasil (MB) |
instacron_str |
MB |
institution |
MB |
reponame_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
collection |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
bitstream.url.fl_str_mv |
https://www.repositorio.mar.mil.br/bitstream/ripcmb/846508/1/Dissertacao-Vinicius-Figueiredo.pdf https://www.repositorio.mar.mil.br/bitstream/ripcmb/846508/2/license.txt |
bitstream.checksum.fl_str_mv |
7c80da2b9a795b0f799f8df99a31c86b 8ff7ce654d5215cee2106f3e3b7eb37f |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB) |
repository.mail.fl_str_mv |
dphdm.repositorio@marinha.mil.br |
_version_ |
1813189001862971392 |