Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFU |
Texto Completo: | https://repositorio.ufu.br/handle/123456789/33882 http://doi.org/10.14393/ufu.di.2021.634 |
Resumo: | Intrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances. |
id |
UFU_ab796602da8e213388f1a21f15985733 |
---|---|
oai_identifier_str |
oai:repositorio.ufu.br:123456789/33882 |
network_acronym_str |
UFU |
network_name_str |
Repositório Institucional da UFU |
repository_id_str |
|
spelling |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dadosPacket intrusion detection using data streamsSistemas de Detecção de IntrusãoAprendizado de MáquinaFluxos Contínuos de DadosPacotes de RedeIntrusion Detection SystemsMachine LearningData StreamsPackets HeaderCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOComputaçãoFluxo de dados (Computação)Aprendizado do computadorRedes de computadores - Sistemas de segurançaIntrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances.Pesquisa sem auxílio de agências de fomentoDissertação (Mestrado)Os Sistemas de Detecção de Intrusão (IDS) auxiliam na proteção das redes de computadores, pois identificam e detectam tentativas de obter acesso não autorizado aos dados, inspecionando pacotes individualmente ou no contexto de fluxos. Considerando que o processo de detecção de intrusão é uma tarefa de classificação de um fluxo de pacotes gerados continuamente em uma distribuição não-estacionária, os modelos de decisão devem sofrer atualizações a fim de identificar mudanças no comportamento dos ataques e do tráfego normal da rede. A atualização dos modelos, em geral, requer instâncias rotuladas, o que exige grande esforço de especialistas. Este trabalho contribuiu com o desenvolvimento de um IDS para o mundo real, propondo: i) comparar o uso de pacotes individuais e fluxos de pacotes na tarefa de detecção de intrusão, por meio da análise do desempenho preditivo de classificadores de fluxos contínuo de dados construídos a partir desses dois tipos de dados; ii) analisar o impacto no desempenho dos classificadores quando há atraso na entrega dos rótulos das instâncias para atualização dos modelos; e iii) avaliar o impacto que as estratégias de aprendizado ativo causam nos classificadores quando somente as melhores instâncias são rotuladas e usadas na atualização dos modelos. Neste sentido, os experimentos foram realizados usando o conjunto de dados CICIDS2017, diferentes algoritmos de classificação de fluxos contínuos de dados e medidas de avaliação. Eles mostraram que inspecionar os pacotes individualmente tem um desempenho semelhante à inspeção de fluxos na detecção de intrusão. De modo que, a partir desse resultado, os pacotes individuais foram usados no estudo de técnicas de aprendizado ativo e atraso na entrega dos rótulos. O desempenho dos classificadores sofreu queda à medida que se aumentava o atraso na entrega dos rótulos verdadeiros. Por fim, as estratégias de aprendizado ativo permitiram manter o desempenho preditivo na classificação de tráfego normal e malicioso, usando um conjunto reduzido de instâncias rotuladas.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoMiani, Rodrigo Sancheshttp://lattes.cnpq.br/2992074747740327Camargos, Lasaro Jonashttp://lattes.cnpq.br/4297695725568502Paiva, Elaine Ribeiro de Fariahttp://lattes.cnpq.br/8238524390290386Senger, Hermeshttp://lattes.cnpq.br/3691742159298316Cattelan, Renan Gonçalveshttp://lattes.cnpq.br/3722586963728305Olímpio Júnior, Gilberto2021-12-30T15:41:07Z2021-12-30T15:41:07Z2021-10-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634https://repositorio.ufu.br/handle/123456789/33882http://doi.org/10.14393/ufu.di.2021.634porhttp://creativecommons.org/licenses/by-nd/3.0/us/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2022-04-26T12:14:15Zoai:repositorio.ufu.br:123456789/33882Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-04-26T12:14:15Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false |
dc.title.none.fl_str_mv |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados Packet intrusion detection using data streams |
title |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
spellingShingle |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados Olímpio Júnior, Gilberto Sistemas de Detecção de Intrusão Aprendizado de Máquina Fluxos Contínuos de Dados Pacotes de Rede Intrusion Detection Systems Machine Learning Data Streams Packets Header CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Computação Fluxo de dados (Computação) Aprendizado do computador Redes de computadores - Sistemas de segurança |
title_short |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
title_full |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
title_fullStr |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
title_full_unstemmed |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
title_sort |
Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados |
author |
Olímpio Júnior, Gilberto |
author_facet |
Olímpio Júnior, Gilberto |
author_role |
author |
dc.contributor.none.fl_str_mv |
Miani, Rodrigo Sanches http://lattes.cnpq.br/2992074747740327 Camargos, Lasaro Jonas http://lattes.cnpq.br/4297695725568502 Paiva, Elaine Ribeiro de Faria http://lattes.cnpq.br/8238524390290386 Senger, Hermes http://lattes.cnpq.br/3691742159298316 Cattelan, Renan Gonçalves http://lattes.cnpq.br/3722586963728305 |
dc.contributor.author.fl_str_mv |
Olímpio Júnior, Gilberto |
dc.subject.por.fl_str_mv |
Sistemas de Detecção de Intrusão Aprendizado de Máquina Fluxos Contínuos de Dados Pacotes de Rede Intrusion Detection Systems Machine Learning Data Streams Packets Header CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Computação Fluxo de dados (Computação) Aprendizado do computador Redes de computadores - Sistemas de segurança |
topic |
Sistemas de Detecção de Intrusão Aprendizado de Máquina Fluxos Contínuos de Dados Pacotes de Rede Intrusion Detection Systems Machine Learning Data Streams Packets Header CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Computação Fluxo de dados (Computação) Aprendizado do computador Redes de computadores - Sistemas de segurança |
description |
Intrusion Detection Systems (IDSs) help protect computer networks by identify and detect attempts to obtain unauthorized access to data via computer networks by inspecting packets separately or in the context of flows. Considering that the intrusion detection process is a classification task of continuously stream-generated packets in a non-stationary distribution, security analysis must constantly update decision models to identify changes in attack behaviors and normal traffic of a network. Since improving models usually requires labeled instances, which demands significant effort from security specialists, the purpose of this work is to contribute to the development of real-world IDSs. Therefore, our goal is to: i) compare the use of individual packets and network flows in the intrusion detection task by analyzing the predictive performance of data stream classifiers; ii) analyze the impact of delayed labelling for updating the models on the classifiers’ performance; and iii) evaluate the impact of active learning strategies on the classifiers’ performance. Our experimental evaluation used the CICIDS2017 dataset, different data stream classification algorithms, and five evaluation measures. Experiments have shown packet-based IDSs perform similarly to flow-based IDSs. Based on this result, we studied different active learning techniques to estimate the impact of delayed labelling on packet-based IDSs. The performance of the classifiers is inversely proportional as the label delivery rate. Besides, the active learning strategies helped keep the performance at a satisfactory level, even with a small set of labeled instances. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-12-30T15:41:07Z 2021-12-30T15:41:07Z 2021-10-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
OLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634 https://repositorio.ufu.br/handle/123456789/33882 http://doi.org/10.14393/ufu.di.2021.634 |
identifier_str_mv |
OLÍMPIO JÚNIOR, Gilberto. Detecção de intrusão sobre pacotes utilizando algoritmos de fluxos contínuos de dados. 2021. 126 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2021. DOI http://doi.org/10.14393/ufu.di.2021.634 |
url |
https://repositorio.ufu.br/handle/123456789/33882 http://doi.org/10.14393/ufu.di.2021.634 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nd/3.0/us/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nd/3.0/us/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Programa de Pós-graduação em Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Uberlândia Brasil Programa de Pós-graduação em Ciência da Computação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFU instname:Universidade Federal de Uberlândia (UFU) instacron:UFU |
instname_str |
Universidade Federal de Uberlândia (UFU) |
instacron_str |
UFU |
institution |
UFU |
reponame_str |
Repositório Institucional da UFU |
collection |
Repositório Institucional da UFU |
repository.name.fl_str_mv |
Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU) |
repository.mail.fl_str_mv |
diinf@dirbi.ufu.br |
_version_ |
1813711301305696256 |