Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/13552 |
Resumo: | The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks. |
id |
UFRJ_a21c72f6a2344c62ef0b84a7a7b1fa5e |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/13552 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionadaDiscovering user traffic profiles: an unsupervised approachRedes de acesso residencialPerfis de tráfegoAprendizado de máquinaCNPQ::ENGENHARIASThe increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks.As redes domésticas estão cada vez mais complexas. Portanto, é essencial a elaboração de estratégias inovadoras para caracterizar essa nova demanda. Em particular, entender as características do tráfego gerado pelos usuários é de suma importância para o planejamento da rede. Trabalhos anteriores focam principalmente na Inspeção Profunda de Pacotes (DPI) e/ou consideram padrões predeterminados para classificar os fluxos de tráfego e determinar a aplicação sendo utilizada pelos usuários. Neste trabalho utilizam-se técnicas não supervisionadas de aprendizado de máquina com o objetivo de entender o per l de tráfego dos usuários. Em parceria com um Provedor de Serviço Internet (ISP), foram coletados dados do tráfego de download e upload de mais de 2.000 roteadores domésticos. Em seguida, é aplicada uma técnica de decomposição de tensores (PARAFAC) para extrair fatores relevantes de uso da rede. Mostra-se como os resultados do PARAFAC e de um algoritmo de clusterização hierárquica simplificam a tarefa de agrupamento de séries temporais com padrões de tráfego diário similares. Também se mostra como novos usuários podem ser classificados a partir da árvore de decisão obtida com a clusterização. Para caracterizar o comportamento dos usuários em períodos maiores que um dia, utiliza-se a informação dos clusters e de um Modelo de Markov Oculto (HMM). Resultados do modelo indicam que os usuários tendem a manter um padrão específico ao longo do tempo, facilitando tarefas de planejamento e gerenciamento da rede.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJLeão, Rosa Maria Merihttp://lattes.cnpq.br/3553487130003978http://lattes.cnpq.br/6499247708538462Silva, Edmundo Albuquerque de Souza eTeixeira, Renata CruzStreit, Ananda Görck2021-01-22T00:17:09Z2023-12-21T03:07:22Z2019-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13552porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:07:22Zoai:pantheon.ufrj.br:11422/13552Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:07:22Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada Discovering user traffic profiles: an unsupervised approach |
title |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
spellingShingle |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada Streit, Ananda Görck Redes de acesso residencial Perfis de tráfego Aprendizado de máquina CNPQ::ENGENHARIAS |
title_short |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
title_full |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
title_fullStr |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
title_full_unstemmed |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
title_sort |
Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada |
author |
Streit, Ananda Görck |
author_facet |
Streit, Ananda Görck |
author_role |
author |
dc.contributor.none.fl_str_mv |
Leão, Rosa Maria Meri http://lattes.cnpq.br/3553487130003978 http://lattes.cnpq.br/6499247708538462 Silva, Edmundo Albuquerque de Souza e Teixeira, Renata Cruz |
dc.contributor.author.fl_str_mv |
Streit, Ananda Görck |
dc.subject.por.fl_str_mv |
Redes de acesso residencial Perfis de tráfego Aprendizado de máquina CNPQ::ENGENHARIAS |
topic |
Redes de acesso residencial Perfis de tráfego Aprendizado de máquina CNPQ::ENGENHARIAS |
description |
The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-02 2021-01-22T00:17:09Z 2023-12-21T03:07:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/13552 |
url |
http://hdl.handle.net/11422/13552 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia de Sistemas e Computação UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815456011788484608 |