Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade

Detalhes bibliográficos
Autor(a) principal: Oliveira, Andressa Stéfany Silva de
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/32366
Resumo: Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream.
id UFRN_750aa0feb73b90bdda83ed6793b264d3
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/32366
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Oliveira, Andressa Stéfany Silva dehttp://lattes.cnpq.br/3582580885769495http://lattes.cnpq.br/7987212907837941Leite, Daniel FurtadoAloise, DanielFernandes, Marcelo Augusto CostaOliveira, Luiz Affonso Henderson Guedes de2021-05-04T18:14:05Z2021-05-04T18:14:05Z2021-03-19OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/32366Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream.Situations that generate a continuous data stream under a changing environment, such as TCP / IP traffic, e-commerce, and industrial monitoring, can make the usability of offline algorithms for machine learning infeasible. That is due to the need for data storage, infinite growth of data generation, and memory restrictions, making models impossible to redesign and retrain. As a consequence of that, algorithms that work in a fully or partially on-line fashion have arisen. Among them, evolving algorithms is a prominent approach because such algorithms can develop and update models’ parameters and structure in unknown environments and detect concepts drift and evolution in the input-output data over time. Because evolving approaches and models are highly applicable in real-world problems, this work proposes a new evolving clustering algorithm named Macro SOStream. This algorithm performs on-line learning and is based on self-organizing density for data stream clustering. The Macro SOStream is based on the SOStream algorithm; however, we incorporate the notion of macroclusters as a microclusters’ composition. While microclusters have spherical shapes, macroclusters may assume arbitrary shapes. For the experiments, were used the benchmark datasets quite usual in the literature, the clustering performance metric Adjusted Rand Index (ARI), and is performed at the average time of the algorithms’ execution with the datasets. The results indicated that the performance and average execution time of the Macro SOStream algorithm are comparable to those of SOStream and DenStream.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilSistemas evolutivosFluxo de dadosAprendizado onlineClusterizaçãoMacro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALMacroSOStreamalgoritmo_Oliveira_2021.pdfapplication/pdf8197495https://repositorio.ufrn.br/bitstream/123456789/32366/1/MacroSOStreamalgoritmo_Oliveira_2021.pdf1d1b33313544ae400eb20b7b63ba35b6MD51123456789/323662021-05-04 15:14:53.124oai:https://repositorio.ufrn.br:123456789/32366Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-05-04T18:14:53Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
spellingShingle Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
Oliveira, Andressa Stéfany Silva de
Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
title_short Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_full Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_fullStr Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_full_unstemmed Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
title_sort Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
author Oliveira, Andressa Stéfany Silva de
author_facet Oliveira, Andressa Stéfany Silva de
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3582580885769495
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7987212907837941
dc.contributor.referees1.none.fl_str_mv Leite, Daniel Furtado
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees2.none.fl_str_mv Aloise, Daniel
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees3.none.fl_str_mv Fernandes, Marcelo Augusto Costa
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv Oliveira, Andressa Stéfany Silva de
dc.contributor.advisor1.fl_str_mv Oliveira, Luiz Affonso Henderson Guedes de
contributor_str_mv Oliveira, Luiz Affonso Henderson Guedes de
dc.subject.por.fl_str_mv Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
topic Sistemas evolutivos
Fluxo de dados
Aprendizado online
Clusterização
description Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-05-04T18:14:05Z
dc.date.available.fl_str_mv 2021-05-04T18:14:05Z
dc.date.issued.fl_str_mv 2021-03-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/32366
identifier_str_mv OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/32366
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/32366/1/MacroSOStreamalgoritmo_Oliveira_2021.pdf
bitstream.checksum.fl_str_mv 1d1b33313544ae400eb20b7b63ba35b6
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814833006803681280