Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados

Detalhes bibliográficos
Autor(a) principal: Olímpio Júnior, Gilberto
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/33882
http://doi.org/10.14393/ufu.di.2021.634
Resumo: Intrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances.
id UFU_ab796602da8e213388f1a21f15985733
oai_identifier_str oai:repositorio.ufu.br:123456789/33882
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dadosPacket intrusion detection using data streamsSistemas de Detecção de IntrusãoAprendizado de MáquinaFluxos Contínuos de DadosPacotes de RedeIntrusion Detection SystemsMachine LearningData StreamsPackets HeaderCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOComputaçãoFluxo de dados (Computação)Aprendizado do computadorRedes de computadores - Sistemas de segurançaIntrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances.Pesquisa sem auxílio de agências de fomentoDissertação (Mestrado)Os Sistemas de Detecção de Intrusão (IDS) auxiliam na proteção das redes de computadores, pois identificam e detectam tentativas de obter acesso não autorizado aos dados, inspecionando pacotes individualmente ou no contexto de fluxos. Considerando que o processo de detecção de intrusão é uma tarefa de classificação de um fluxo de pacotes gerados continuamente em uma distribuição não-estacionária, os modelos de decisão devem sofrer atualizações a fim de identificar mudanças no comportamento dos ataques e do tráfego normal da rede. A atualização dos modelos, em geral, requer instâncias rotuladas, o que exige grande esforço de especialistas. Este trabalho contribuiu com o desenvolvimento de um IDS para o mundo real, propondo: i) comparar o uso de pacotes individuais e fluxos de pacotes na tarefa de detecção de intrusão, por meio da análise do desempenho preditivo de classificadores de fluxos contínuo de dados construídos a partir desses dois tipos de dados; ii) analisar o impacto no desempenho dos classificadores quando há atraso na entrega dos rótulos das instâncias para atualização dos modelos; e iii) avaliar o impacto que as estratégias de aprendizado ativo causam nos classificadores quando somente as melhores instâncias são rotuladas e usadas na atualização dos modelos. Neste sentido, os experimentos foram realizados usando o conjunto de dados CICIDS2017, diferentes algoritmos de classificação de fluxos contínuos de dados e medidas de avaliação. Eles mostraram que inspecionar os pacotes individualmente tem um desempenho semelhante à inspeção de fluxos na detecção de intrusão. De modo que, a partir desse resultado, os pacotes individuais foram usados no estudo de técnicas de aprendizado ativo e atraso na entrega dos rótulos. O desempenho dos classificadores sofreu queda à medida que se aumentava o atraso na entrega dos rótulos verdadeiros. Por fim, as estratégias de aprendizado ativo permitiram manter o desempenho preditivo na classificação de tráfego normal e malicioso, usando um conjunto reduzido de instâncias rotuladas.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoMiani, Rodrigo Sancheshttp://lattes.cnpq.br/2992074747740327Camargos, Lasaro Jonashttp://lattes.cnpq.br/4297695725568502Paiva, Elaine Ribeiro de Fariahttp://lattes.cnpq.br/8238524390290386Senger, Hermeshttp://lattes.cnpq.br/3691742159298316Cattelan, Renan Gonçalveshttp://lattes.cnpq.br/3722586963728305Olímpio Júnior, Gilberto2021-12-30T15:41:07Z2021-12-30T15:41:07Z2021-10-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634https://repositorio.ufu.br/handle/123456789/33882http://doi.org/10.14393/ufu.di.2021.634porhttp://creativecommons.org/licenses/by-nd/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2022-04-26T12:14:15Zoai:repositorio.ufu.br:123456789/33882Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-04-26T12:14:15Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
Packet intrusion detection using data streams
title Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
spellingShingle Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
Olímpio Júnior, Gilberto
Sistemas de Detecção de Intrusão
Aprendizado de Máquina
Fluxos Contínuos de Dados
Pacotes de Rede
Intrusion Detection Systems
Machine Learning
Data Streams
Packets Header
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Computação
Fluxo de dados (Computação)
Aprendizado do computador
Redes de computadores - Sistemas de segurança
title_short Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
title_full Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
title_fullStr Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
title_full_unstemmed Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
title_sort Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
author Olímpio Júnior, Gilberto
author_facet Olímpio Júnior, Gilberto
author_role author
dc.contributor.none.fl_str_mv Miani, Rodrigo Sanches
http://lattes.cnpq.br/2992074747740327
Camargos, Lasaro Jonas
http://lattes.cnpq.br/4297695725568502
Paiva, Elaine Ribeiro de Faria
http://lattes.cnpq.br/8238524390290386
Senger, Hermes
http://lattes.cnpq.br/3691742159298316
Cattelan, Renan Gonçalves
http://lattes.cnpq.br/3722586963728305
dc.contributor.author.fl_str_mv Olímpio Júnior, Gilberto
dc.subject.por.fl_str_mv Sistemas de Detecção de Intrusão
Aprendizado de Máquina
Fluxos Contínuos de Dados
Pacotes de Rede
Intrusion Detection Systems
Machine Learning
Data Streams
Packets Header
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Computação
Fluxo de dados (Computação)
Aprendizado do computador
Redes de computadores - Sistemas de segurança
topic Sistemas de Detecção de Intrusão
Aprendizado de Máquina
Fluxos Contínuos de Dados
Pacotes de Rede
Intrusion Detection Systems
Machine Learning
Data Streams
Packets Header
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Computação
Fluxo de dados (Computação)
Aprendizado do computador
Redes de computadores - Sistemas de segurança
description Intrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-30T15:41:07Z
2021-12-30T15:41:07Z
2021-10-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv OLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634
https://repositorio.ufu.br/handle/123456789/33882
http://doi.org/10.14393/ufu.di.2021.634
identifier_str_mv OLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634
url https://repositorio.ufu.br/handle/123456789/33882
http://doi.org/10.14393/ufu.di.2021.634
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nd/3.0/us/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nd/3.0/us/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1813711301305696256