Detecção de intrusão em rede por aprendizado de máquina distribuído

Pereira, Lucas Fauster Leite

Detecção de intrusão em rede por aprendizado de máquina distribuído

Detalhes bibliográficos
Autor(a) principal:	Pereira, Lucas Fauster Leite
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo:	http://app.uff.br/riuff/handle/1/27941
Resumo:	Os Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.

Metadados do item

id	UFF-2_b849c0cdd28eafd8940aa8c206e70b9d
oai_identifier_str	oai:app.uff.br:1/27941
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str	2120
spelling	Detecção de intrusão em rede por aprendizado de máquina distribuídoMLSistemas distribuídosIDSLGPDAprendizado de máquinaSegurança de dados on-lineProcessamento de dados (Computação)Distributed SystemsOs Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.Intrusion Detection Systems are used in networks to monitor data flows to detect and contain cyber attacks. Machine learning emerges as a solution for intrusion detection due to its ability to recognize patterns in data efficiently. However, machine learning systems, which hold centralized data storage, have to be responsible for the security of this data according to the LGPD and also need to handle all data processing. Distributed machine learning proposes a solution for training models collaboratively, in which each participant shares only the locally trained model, keeping the local data on their devices. In this work, we propose a Distributed Machine Learning System for Intrusion Detection with Peer-to-Peer Communication Topology using a shared Decision Tree model, in which the shared trees compose a Distributed Decision Forest. The work simulates and compares the proposal with a Distributed Machine Learning System for Intrusion Detection with Parameter Server Communication Topology, using a Neural Network as a machine learning model. The simulations show that the Distributed Decision Forest model reached a median accuracy of 79% in just one training round. The Neural Network model achieved a median accuracy of 86% with the same amount of data but in 10 training rounds. Models’ training accounts with over 6GB of flow data from a real-world telecommunications network operator. The result shows that the Distributed Decision Forest model has less processing overhead and greater data privacy to achieve performance comparable to the federated neural network54 p.Mattos, Diogo Menezes FerrazaniMoraes, Igor MonteiroBastos, Ian VilarCunha Neto, Helio do NascimentoPereira, Lucas Fauster Leite2023-02-24T11:42:09Z2023-02-24T11:42:09Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfPEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022.http://app.uff.br/riuff/handle/1/27941CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-02-24T11:42:12Zoai:app.uff.br:1/27941Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-02-24T11:42:12Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Detecção de intrusão em rede por aprendizado de máquina distribuído
title	Detecção de intrusão em rede por aprendizado de máquina distribuído
spellingShingle	Detecção de intrusão em rede por aprendizado de máquina distribuído Pereira, Lucas Fauster Leite ML Sistemas distribuídos IDS LGPD Aprendizado de máquina Segurança de dados on-line Processamento de dados (Computação) Distributed Systems
title_short	Detecção de intrusão em rede por aprendizado de máquina distribuído
title_full	Detecção de intrusão em rede por aprendizado de máquina distribuído
title_fullStr	Detecção de intrusão em rede por aprendizado de máquina distribuído
title_full_unstemmed	Detecção de intrusão em rede por aprendizado de máquina distribuído
title_sort	Detecção de intrusão em rede por aprendizado de máquina distribuído
author	Pereira, Lucas Fauster Leite
author_facet	Pereira, Lucas Fauster Leite
author_role	author
dc.contributor.none.fl_str_mv	Mattos, Diogo Menezes Ferrazani Moraes, Igor Monteiro Bastos, Ian Vilar Cunha Neto, Helio do Nascimento
dc.contributor.author.fl_str_mv	Pereira, Lucas Fauster Leite
dc.subject.por.fl_str_mv	ML Sistemas distribuídos IDS LGPD Aprendizado de máquina Segurança de dados on-line Processamento de dados (Computação) Distributed Systems
topic	ML Sistemas distribuídos IDS LGPD Aprendizado de máquina Segurança de dados on-line Processamento de dados (Computação) Distributed Systems
description	Os Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.
publishDate	2023
dc.date.none.fl_str_mv	2023-02-24T11:42:09Z 2023-02-24T11:42:09Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	PEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022. http://app.uff.br/riuff/handle/1/27941
identifier_str_mv	PEREIRA, Lucas Fauster Leite. Detecção de intrusão em rede por aprendizado de máquina distribuído. 2022. 54 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Informação) - Universidade Federal Fluminense, Instituto de Computação, Niterói, 2022.
url	http://app.uff.br/riuff/handle/1/27941
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1807838682471727104

Detecção de intrusão em rede por aprendizado de máquina distribuído

Registros relacionados