Detecção de intrusão em rede por aprendizado de máquina distribuído

Detalhes bibliográficos
Autor(a) principal: Pereira, Lucas Fauster Leite
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/27941
Resumo: Os Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.
id UFF-2_b849c0cdd28eafd8940aa8c206e70b9d
oai_identifier_str oai:app.uff.br:1/27941
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Detecção de intrusão em rede por aprendizado de máquina distribuídoMLSistemas distribuídosIDSLGPDAprendizado de máquinaSegurança de dados on-lineProcessamento de dados (Computação)Distributed SystemsOs Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.Intrusion Detection Systems are used in networks to monitor data flows to detect and contain cyber attacks. Machine learning emerges as a solution for intrusion detection due to its ability to recognize patterns in data efficiently. However, machine learning systems, which hold centralized data storage, have to be responsible for the security of this data according to the LGPD and also need to handle all data processing. Distributed machine learning proposes a solution for training models collaboratively, in which each participant shares only the locally trained model, keeping the local data on their devices. In this work, we propose a Distributed Machine Learning System for Intrusion Detection with Peer-to-Peer Communication Topology using a shared Decision Tree model, in which the shared trees compose a Distributed Decision Forest. The work simulates and compares the proposal with a Distributed Machine Learning System for Intrusion Detection with Parameter Server Communication Topology, using a Neural Network as a machine learning model. The simulations show that the Distributed Decision Forest model reached a median accuracy of 79% in just one training round. The Neural Network model achieved a median accuracy of 86% with the same amount of data but in 10 training rounds. Models’ training accounts with over 6GB of flow data from a real-world telecommunications network operator. The result shows that the Distributed Decision Forest model has less processing overhead and greater data privacy to achieve performance comparable to the federated neural network54 p.Mattos, Diogo Menezes FerrazaniMoraes, Igor MonteiroBastos, Ian VilarCunha Neto, Helio do NascimentoPereira, Lucas Fauster Leite2023-02-24T11:42:09Z2023-02-24T11:42:09Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022.http://app.uff.br/riuff/handle/1/27941CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-02-24T11:42:12Zoai:app.uff.br:1/27941Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-02-24T11:42:12Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Detecção de intrusão em rede por aprendizado de máquina distribuído
title Detecção de intrusão em rede por aprendizado de máquina distribuído
spellingShingle Detecção de intrusão em rede por aprendizado de máquina distribuído
Pereira, Lucas Fauster Leite
ML
Sistemas distribuídos
IDS
LGPD
Aprendizado de máquina
Segurança de dados on-line
Processamento de dados (Computação)
Distributed Systems
title_short Detecção de intrusão em rede por aprendizado de máquina distribuído
title_full Detecção de intrusão em rede por aprendizado de máquina distribuído
title_fullStr Detecção de intrusão em rede por aprendizado de máquina distribuído
title_full_unstemmed Detecção de intrusão em rede por aprendizado de máquina distribuído
title_sort Detecção de intrusão em rede por aprendizado de máquina distribuído
author Pereira, Lucas Fauster Leite
author_facet Pereira, Lucas Fauster Leite
author_role author
dc.contributor.none.fl_str_mv Mattos, Diogo Menezes Ferrazani
Moraes, Igor Monteiro
Bastos, Ian Vilar
Cunha Neto, Helio do Nascimento
dc.contributor.author.fl_str_mv Pereira, Lucas Fauster Leite
dc.subject.por.fl_str_mv ML
Sistemas distribuídos
IDS
LGPD
Aprendizado de máquina
Segurança de dados on-line
Processamento de dados (Computação)
Distributed Systems
topic ML
Sistemas distribuídos
IDS
LGPD
Aprendizado de máquina
Segurança de dados on-line
Processamento de dados (Computação)
Distributed Systems
description Os Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.
publishDate 2023
dc.date.none.fl_str_mv 2023-02-24T11:42:09Z
2023-02-24T11:42:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022.
http://app.uff.br/riuff/handle/1/27941
identifier_str_mv PEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022.
url http://app.uff.br/riuff/handle/1/27941
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1807838682471727104