Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada

Detalhes bibliográficos
Autor(a) principal: Streit, Ananda Görck
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/13552
Resumo: The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks.
id UFRJ_a21c72f6a2344c62ef0b84a7a7b1fa5e
oai_identifier_str oai:pantheon.ufrj.br:11422/13552
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionadaDiscovering user traffic profiles: an unsupervised approachRedes de acesso residencialPerfis de tráfegoAprendizado de máquinaCNPQ::ENGENHARIASThe increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks.As redes domésticas estão cada vez mais complexas. Portanto, é essencial a elaboração de estratégias inovadoras para caracterizar essa nova demanda. Em particular, entender as características do tráfego gerado pelos usuários é de suma importância para o planejamento da rede. Trabalhos anteriores focam principalmente na Inspeção Profunda de Pacotes (DPI) e/ou consideram padrões predeterminados para classificar os fluxos de tráfego e determinar a aplicação sendo utilizada pelos usuários. Neste trabalho utilizam-se técnicas não supervisionadas de aprendizado de máquina com o objetivo de entender o per l de tráfego dos usuários. Em parceria com um Provedor de Serviço Internet (ISP), foram coletados dados do tráfego de download e upload de mais de 2.000 roteadores domésticos. Em seguida, é aplicada uma técnica de decomposição de tensores (PARAFAC) para extrair fatores relevantes de uso da rede. Mostra-se como os resultados do PARAFAC e de um algoritmo de clusterização hierárquica simplificam a tarefa de agrupamento de séries temporais com padrões de tráfego diário similares. Também se mostra como novos usuários podem ser classificados a partir da árvore de decisão obtida com a clusterização. Para caracterizar o comportamento dos usuários em períodos maiores que um dia, utiliza-se a informação dos clusters e de um Modelo de Markov Oculto (HMM). Resultados do modelo indicam que os usuários tendem a manter um padrão específico ao longo do tempo, facilitando tarefas de planejamento e gerenciamento da rede.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJLeão, Rosa Maria Merihttp://lattes.cnpq.br/3553487130003978http://lattes.cnpq.br/6499247708538462Silva, Edmundo Albuquerque de Souza eTeixeira, Renata CruzStreit, Ananda Görck2021-01-22T00:17:09Z2023-12-21T03:07:22Z2019-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13552porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:07:22Zoai:pantheon.ufrj.br:11422/13552Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:07:22Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.none.fl_str_mv Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
Discovering user traffic profiles: an unsupervised approach
title Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
spellingShingle Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
Streit, Ananda Görck
Redes de acesso residencial
Perfis de tráfego
Aprendizado de máquina
CNPQ::ENGENHARIAS
title_short Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
title_full Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
title_fullStr Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
title_full_unstemmed Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
title_sort Descobrindo perfis de tráfego de usuários: uma abordagem não supervisionada
author Streit, Ananda Görck
author_facet Streit, Ananda Görck
author_role author
dc.contributor.none.fl_str_mv Leão, Rosa Maria Meri
http://lattes.cnpq.br/3553487130003978
http://lattes.cnpq.br/6499247708538462
Silva, Edmundo Albuquerque de Souza e
Teixeira, Renata Cruz
dc.contributor.author.fl_str_mv Streit, Ananda Görck
dc.subject.por.fl_str_mv Redes de acesso residencial
Perfis de tráfego
Aprendizado de máquina
CNPQ::ENGENHARIAS
topic Redes de acesso residencial
Perfis de tráfego
Aprendizado de máquina
CNPQ::ENGENHARIAS
description The increasing complexity of home networks calls for novel strategies towards e cient network management and workload characterization. In particular, understanding the characteristics of the tra c generated by users is of paramount importance for network planning. Previous work focuses primarily on Deep Packet Inspection (DPI) and/or considers pre-determined patterns to classify tra c ows and detect the application being accessed by users. In this work we use unsupervised machine learning techniques with the objective of discovering users’ tra c pro les. In partnership with an Internet Service Provider (ISP) we collected the download and upload tra c of more than 2,000 home routers of the ISP clients. We then use a tensor decomposition technique (PARAFAC) to extract relevant features from our network traces. We show how the results of PARAFAC and a hierarchical clustering algorithm simplify the task of grouping time series with similar daily tra c patterns. We also show how new users can be classi ed from the decision tree obtained with clustering. To characterize users’ behavior over periods longer than a day, we use the information of the clusters and a Hidden Markov Model (HMM). The results indicate that users tend to maintain a speci c pattern over time, facilitating network planning and management tasks.
publishDate 2019
dc.date.none.fl_str_mv 2019-02
2021-01-22T00:17:09Z
2023-12-21T03:07:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/13552
url http://hdl.handle.net/11422/13552
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv pantheon@sibi.ufrj.br
_version_ 1815456011788484608