Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/32366 |
Resumo: | Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream. |
id |
UFRN_750aa0feb73b90bdda83ed6793b264d3 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/32366 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Oliveira, Andressa Stéfany Silva dehttp://lattes.cnpq.br/3582580885769495http://lattes.cnpq.br/7987212907837941Leite, Daniel FurtadoAloise, DanielFernandes, Marcelo Augusto CostaOliveira, Luiz Affonso Henderson Guedes de2021-05-04T18:14:05Z2021-05-04T18:14:05Z2021-03-19OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/32366Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream.Situations that generate a continuous data stream under a changing environment, such as TCP / IP traffic, e-commerce, and industrial monitoring, can make the usability of offline algorithms for machine learning infeasible. That is due to the need for data storage, infinite growth of data generation, and memory restrictions, making models impossible to redesign and retrain. As a consequence of that, algorithms that work in a fully or partially on-line fashion have arisen. Among them, evolving algorithms is a prominent approach because such algorithms can develop and update models’ parameters and structure in unknown environments and detect concepts drift and evolution in the input-output data over time. Because evolving approaches and models are highly applicable in real-world problems, this work proposes a new evolving clustering algorithm named Macro SOStream. This algorithm performs on-line learning and is based on self-organizing density for data stream clustering. The Macro SOStream is based on the SOStream algorithm; however, we incorporate the notion of macroclusters as a microclusters’ composition. While microclusters have spherical shapes, macroclusters may assume arbitrary shapes. For the experiments, were used the benchmark datasets quite usual in the literature, the clustering performance metric Adjusted Rand Index (ARI), and is performed at the average time of the algorithms’ execution with the datasets. The results indicated that the performance and average execution time of the Macro SOStream algorithm are comparable to those of SOStream and DenStream.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilSistemas evolutivosFluxo de dadosAprendizado onlineClusterizaçãoMacro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALMacroSOStreamalgoritmo_Oliveira_2021.pdfapplication/pdf8197495https://repositorio.ufrn.br/bitstream/123456789/32366/1/MacroSOStreamalgoritmo_Oliveira_2021.pdf1d1b33313544ae400eb20b7b63ba35b6MD51123456789/323662021-05-04 15:14:53.124oai:https://repositorio.ufrn.br:123456789/32366Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-05-04T18:14:53Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
title |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
spellingShingle |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade Oliveira, Andressa Stéfany Silva de Sistemas evolutivos Fluxo de dados Aprendizado online Clusterização |
title_short |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
title_full |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
title_fullStr |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
title_full_unstemmed |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
title_sort |
Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade |
author |
Oliveira, Andressa Stéfany Silva de |
author_facet |
Oliveira, Andressa Stéfany Silva de |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
|
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3582580885769495 |
dc.contributor.advisorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7987212907837941 |
dc.contributor.referees1.none.fl_str_mv |
Leite, Daniel Furtado |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees2.none.fl_str_mv |
Aloise, Daniel |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
|
dc.contributor.referees3.none.fl_str_mv |
Fernandes, Marcelo Augusto Costa |
dc.contributor.referees3ID.pt_BR.fl_str_mv |
|
dc.contributor.author.fl_str_mv |
Oliveira, Andressa Stéfany Silva de |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de |
contributor_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de |
dc.subject.por.fl_str_mv |
Sistemas evolutivos Fluxo de dados Aprendizado online Clusterização |
topic |
Sistemas evolutivos Fluxo de dados Aprendizado online Clusterização |
description |
Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-05-04T18:14:05Z |
dc.date.available.fl_str_mv |
2021-05-04T18:14:05Z |
dc.date.issued.fl_str_mv |
2021-03-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/32366 |
identifier_str_mv |
OLIVEIRA, Andressa Stéfany Silva de. Macro SOStream: um algoritmo evolutivo para agrupamento autoorganizado baseado em densidade. 2021. 72f. Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
url |
https://repositorio.ufrn.br/handle/123456789/32366 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/32366/1/MacroSOStreamalgoritmo_Oliveira_2021.pdf |
bitstream.checksum.fl_str_mv |
1d1b33313544ae400eb20b7b63ba35b6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814833006803681280 |