Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-21092023-082915/ |
Resumo: | Distributed Denial of Service (DDoS) Attacks - Ataques de Negação de Serviço Distribuídos - impõem um grande desafio para os sistemas de segurança atuais, dadas a variedade de suas implementações e as grandes escalas que podem atingir. Uma abordagem para a sua detecção precoce é o uso de técnicas de Machine Learning (ML), que criam regras de classificação do tráfego a partir de dados históricos. Contudo, diferentes tipos de dados contribuem de forma desigual para a assertividade do modelo treinado. O uso de métodos de Feature Selection (FS) - Seleção de Variáveis - como etapa de pré-processamento permite a identificação dos atributos mais relevantes para o problema em questão. Essa ação diminui o tempo de treinamento e pode melhorar o desempenho de classificadores de ataques quando variáveis ruidosas são eliminadas. Este trabalho toma como base um conjunto de dados público e o algoritmo XGBoost para mensurar o impacto de técnicas de FS no problema de classificação de ataques DDoS. São consideradas tanto técnicas independentes dos rótulos das amostras, como também métodos que se utilizam dessa informação para ranquear as variáveis em ordem de importância. O problema é analisado do ponto de vista da classificação binária e multiclasse. Também é criado um benchmark de métricas de classificação e tempos de execução. As comparações envolvem as métricas de Acurácia, Precisão, Recall e F1-score para diversos métodos de FS, além dos tempos para realização de FS e tempos para treinamento do modelo. |
id |
USP_880789788d4cc7399aae743b5dd47088 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21092023-082915 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost.Impact of feature selection methods on the classification of DDoS attacks using XGBoost.Aprendizado computacionalAtaques DDoSBinary classifierDDoSFeature Selection (FS)Inteligência artificialMulticlass classifierSegurança de computadoresSeleção de variáveisXGBoostDistributed Denial of Service (DDoS) Attacks - Ataques de Negação de Serviço Distribuídos - impõem um grande desafio para os sistemas de segurança atuais, dadas a variedade de suas implementações e as grandes escalas que podem atingir. Uma abordagem para a sua detecção precoce é o uso de técnicas de Machine Learning (ML), que criam regras de classificação do tráfego a partir de dados históricos. Contudo, diferentes tipos de dados contribuem de forma desigual para a assertividade do modelo treinado. O uso de métodos de Feature Selection (FS) - Seleção de Variáveis - como etapa de pré-processamento permite a identificação dos atributos mais relevantes para o problema em questão. Essa ação diminui o tempo de treinamento e pode melhorar o desempenho de classificadores de ataques quando variáveis ruidosas são eliminadas. Este trabalho toma como base um conjunto de dados público e o algoritmo XGBoost para mensurar o impacto de técnicas de FS no problema de classificação de ataques DDoS. São consideradas tanto técnicas independentes dos rótulos das amostras, como também métodos que se utilizam dessa informação para ranquear as variáveis em ordem de importância. O problema é analisado do ponto de vista da classificação binária e multiclasse. Também é criado um benchmark de métricas de classificação e tempos de execução. As comparações envolvem as métricas de Acurácia, Precisão, Recall e F1-score para diversos métodos de FS, além dos tempos para realização de FS e tempos para treinamento do modelo.Distributed Denial of Service (DDoS) attacks impose a major challenge for todays security systems, given the variety of its implementations and the scale that the attacks can achieve. One approach for their early detection is the use of Machine Learning (ML) techniques, which create rules for classifying traffic from historical data. However, different types of data contribute unequally to the assertiveness of the trained model. The use of Feature Selection (FS) techniques as a pre-processing step allows identification of the most relevant features for the problem in question. This action reduces training time and can improve performance when noisy variables are eliminated. The current work is based on a public dataset and the XGBoost algorithm to measure the impact of FS techniques on the DDoS attack classification problem. Techniques that are independent of sample labels are considered, as well as methods that use this label information to rank the variables in order of importance. The problem is analyzed from the point of view of binary and multiclass classification. A benchmark of classification metrics and execution times is also created. The comparisons involve the metrics of Accuracy, Precision, Recall and F1-score for different FS methods, in addition to the times to perform FS and model training.Biblioteca Digitais de Teses e Dissertações da USPKofuji, Sergio TakeoAraujo, Pedro Henrique Hauy Netto de2023-08-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-21092023-082915/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-09-22T11:52:03Zoai:teses.usp.br:tde-21092023-082915Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-09-22T11:52:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. Impact of feature selection methods on the classification of DDoS attacks using XGBoost. |
title |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
spellingShingle |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. Araujo, Pedro Henrique Hauy Netto de Aprendizado computacional Ataques DDoS Binary classifier DDoS Feature Selection (FS) Inteligência artificial Multiclass classifier Segurança de computadores Seleção de variáveis XGBoost |
title_short |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
title_full |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
title_fullStr |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
title_full_unstemmed |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
title_sort |
Impacto de métodos de seleção de variáveis na classificação de ataques DDoS utilizando XGBoost. |
author |
Araujo, Pedro Henrique Hauy Netto de |
author_facet |
Araujo, Pedro Henrique Hauy Netto de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Kofuji, Sergio Takeo |
dc.contributor.author.fl_str_mv |
Araujo, Pedro Henrique Hauy Netto de |
dc.subject.por.fl_str_mv |
Aprendizado computacional Ataques DDoS Binary classifier DDoS Feature Selection (FS) Inteligência artificial Multiclass classifier Segurança de computadores Seleção de variáveis XGBoost |
topic |
Aprendizado computacional Ataques DDoS Binary classifier DDoS Feature Selection (FS) Inteligência artificial Multiclass classifier Segurança de computadores Seleção de variáveis XGBoost |
description |
Distributed Denial of Service (DDoS) Attacks - Ataques de Negação de Serviço Distribuídos - impõem um grande desafio para os sistemas de segurança atuais, dadas a variedade de suas implementações e as grandes escalas que podem atingir. Uma abordagem para a sua detecção precoce é o uso de técnicas de Machine Learning (ML), que criam regras de classificação do tráfego a partir de dados históricos. Contudo, diferentes tipos de dados contribuem de forma desigual para a assertividade do modelo treinado. O uso de métodos de Feature Selection (FS) - Seleção de Variáveis - como etapa de pré-processamento permite a identificação dos atributos mais relevantes para o problema em questão. Essa ação diminui o tempo de treinamento e pode melhorar o desempenho de classificadores de ataques quando variáveis ruidosas são eliminadas. Este trabalho toma como base um conjunto de dados público e o algoritmo XGBoost para mensurar o impacto de técnicas de FS no problema de classificação de ataques DDoS. São consideradas tanto técnicas independentes dos rótulos das amostras, como também métodos que se utilizam dessa informação para ranquear as variáveis em ordem de importância. O problema é analisado do ponto de vista da classificação binária e multiclasse. Também é criado um benchmark de métricas de classificação e tempos de execução. As comparações envolvem as métricas de Acurácia, Precisão, Recall e F1-score para diversos métodos de FS, além dos tempos para realização de FS e tempos para treinamento do modelo. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-08-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-21092023-082915/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-21092023-082915/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257250830221312 |