Strict very fast decision tree : a memory conservative algorithm for data stream classification
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UEL |
Texto Completo: | https://repositorio.uel.br/handle/123456789/10561 |
Resumo: | Resumo: Lidar com restrições de memória e tempo são desafios presentes quando deseja-se aprender com fluxos massivos de dados Diversos algoritmos foram propostos para lidar com essas dificuldades, entre eles, a Very Fast Decision Tree (VFDT) Apesar da VFDT ser amplamente utilizada para a mineração de fluxos de dados, nos últimos anos, diversos autores sugeriram mudanças para melhorar a capacidade preditiva desse algoritmo, mas ignorando os altos custos adicionais de memória e tempo ocasionados por essas modificações Além disso, mais recentemente, a maioria dos algoritmos para mineração de fluxos de dados são baseados em ensembles, sendo bem custosos considerando os recursos de memória e tempo Esse estudo apresenta um novo algoritmo baseado na VFDT chamado de Strict VFDT (SVFDT) que reduz custos de memória mantendo capacidade preditiva similar a VFDT Além disso, como as árvores de decisão geradas são mais rasas, a SVFDT acaba reduzindo o tempo computacional necessário para se processar um fluxo de dados Esse algoritmo aplica medidas heurísticas para bloquear divisões de folhas que não resultam em um aumento significativo na capacidade preditiva Foram realizados experimentos comparando a SVFDT com a VFDT em 26 fluxos de dados Após realizar diversas análises, cada qual focando em algum dos múltiplos aspectos dos algoritmos, foi possível observar que o algoritmo proposto é capaz de reduzir drasticamente o consumo de memória enquanto possui capacidade preditiva similar e sendo mais rápido em muitos casos |
id |
UEL_1aeef77528cdf7bc402b02ed056cc0bb |
---|---|
oai_identifier_str |
oai:repositorio.uel.br:123456789/10561 |
network_acronym_str |
UEL |
network_name_str |
Repositório Institucional da UEL |
repository_id_str |
|
spelling |
Strict very fast decision tree : a memory conservative algorithm for data stream classificationMineração de dados (Computação)Algoritmos de computadorAprendizado do computadorData mining (Computing)Computer algoritmsResumo: Lidar com restrições de memória e tempo são desafios presentes quando deseja-se aprender com fluxos massivos de dados Diversos algoritmos foram propostos para lidar com essas dificuldades, entre eles, a Very Fast Decision Tree (VFDT) Apesar da VFDT ser amplamente utilizada para a mineração de fluxos de dados, nos últimos anos, diversos autores sugeriram mudanças para melhorar a capacidade preditiva desse algoritmo, mas ignorando os altos custos adicionais de memória e tempo ocasionados por essas modificações Além disso, mais recentemente, a maioria dos algoritmos para mineração de fluxos de dados são baseados em ensembles, sendo bem custosos considerando os recursos de memória e tempo Esse estudo apresenta um novo algoritmo baseado na VFDT chamado de Strict VFDT (SVFDT) que reduz custos de memória mantendo capacidade preditiva similar a VFDT Além disso, como as árvores de decisão geradas são mais rasas, a SVFDT acaba reduzindo o tempo computacional necessário para se processar um fluxo de dados Esse algoritmo aplica medidas heurísticas para bloquear divisões de folhas que não resultam em um aumento significativo na capacidade preditiva Foram realizados experimentos comparando a SVFDT com a VFDT em 26 fluxos de dados Após realizar diversas análises, cada qual focando em algum dos múltiplos aspectos dos algoritmos, foi possível observar que o algoritmo proposto é capaz de reduzir drasticamente o consumo de memória enquanto possui capacidade preditiva similar e sendo mais rápido em muitos casosDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: Memory and time constraints are current challenges when learning from massive data streams Many algorithms have been proposed to handle these difficulties, among them, the Very Fast Decision Tree (VFDT) Although it has been widely used in data stream mining, in the last years, several authors have suggested modifications to increase its predictive performance, putting aside the high memory and time demands of these modifications Besides, recently, most data stream mining solutions have been centred around ensembles, which are very costly from a memory and time point of view This study presents a novel algorithm based on the VFDT called Strict VFDT (SVFDT) that reduces memory costs while maintaining predictive performance Moreover, since it creates much shallower trees than VFDT, the SVFDT can achieve a shorter computational time It works by blocking splits which would not yield a significant increase in predictive performance using heuristic measures Experiments were carried out comparing the SVFDT with the VFDT in 26 data stream datasets By performing different analysis focusing on multiple aspects of the algorithms, the proposed algorithm was able to greatly reduce memory consumption while yielding similar predictive performance and being faster in many casesBarbon Junior, Sylvio [Orientador]Zarpelão, Bruno BogazMantovani, Rafael GomesCosta, Victor Guilherme Turrisi2024-05-01T12:44:48Z2024-05-01T12:44:48Z2019.0027.03.2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://repositorio.uel.br/handle/123456789/10561porMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da ComputaçãoLondrinareponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess2024-07-12T04:20:12Zoai:repositorio.uel.br:123456789/10561Biblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:20:12Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false |
dc.title.none.fl_str_mv |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
title |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
spellingShingle |
Strict very fast decision tree : a memory conservative algorithm for data stream classification Costa, Victor Guilherme Turrisi Mineração de dados (Computação) Algoritmos de computador Aprendizado do computador Data mining (Computing) Computer algoritms |
title_short |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
title_full |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
title_fullStr |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
title_full_unstemmed |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
title_sort |
Strict very fast decision tree : a memory conservative algorithm for data stream classification |
author |
Costa, Victor Guilherme Turrisi |
author_facet |
Costa, Victor Guilherme Turrisi |
author_role |
author |
dc.contributor.none.fl_str_mv |
Barbon Junior, Sylvio [Orientador] Zarpelão, Bruno Bogaz Mantovani, Rafael Gomes |
dc.contributor.author.fl_str_mv |
Costa, Victor Guilherme Turrisi |
dc.subject.por.fl_str_mv |
Mineração de dados (Computação) Algoritmos de computador Aprendizado do computador Data mining (Computing) Computer algoritms |
topic |
Mineração de dados (Computação) Algoritmos de computador Aprendizado do computador Data mining (Computing) Computer algoritms |
description |
Resumo: Lidar com restrições de memória e tempo são desafios presentes quando deseja-se aprender com fluxos massivos de dados Diversos algoritmos foram propostos para lidar com essas dificuldades, entre eles, a Very Fast Decision Tree (VFDT) Apesar da VFDT ser amplamente utilizada para a mineração de fluxos de dados, nos últimos anos, diversos autores sugeriram mudanças para melhorar a capacidade preditiva desse algoritmo, mas ignorando os altos custos adicionais de memória e tempo ocasionados por essas modificações Além disso, mais recentemente, a maioria dos algoritmos para mineração de fluxos de dados são baseados em ensembles, sendo bem custosos considerando os recursos de memória e tempo Esse estudo apresenta um novo algoritmo baseado na VFDT chamado de Strict VFDT (SVFDT) que reduz custos de memória mantendo capacidade preditiva similar a VFDT Além disso, como as árvores de decisão geradas são mais rasas, a SVFDT acaba reduzindo o tempo computacional necessário para se processar um fluxo de dados Esse algoritmo aplica medidas heurísticas para bloquear divisões de folhas que não resultam em um aumento significativo na capacidade preditiva Foram realizados experimentos comparando a SVFDT com a VFDT em 26 fluxos de dados Após realizar diversas análises, cada qual focando em algum dos múltiplos aspectos dos algoritmos, foi possível observar que o algoritmo proposto é capaz de reduzir drasticamente o consumo de memória enquanto possui capacidade preditiva similar e sendo mais rápido em muitos casos |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2019.00 2024-05-01T12:44:48Z 2024-05-01T12:44:48Z 27.03.2019 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.uel.br/handle/123456789/10561 |
url |
https://repositorio.uel.br/handle/123456789/10561 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Mestrado Ciência da Computação Centro de Ciências Exatas Programa de Pós-Graduação em Ciência da Computação |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
Londrina |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UEL instname:Universidade Estadual de Londrina (UEL) instacron:UEL |
instname_str |
Universidade Estadual de Londrina (UEL) |
instacron_str |
UEL |
institution |
UEL |
reponame_str |
Repositório Institucional da UEL |
collection |
Repositório Institucional da UEL |
repository.name.fl_str_mv |
Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL) |
repository.mail.fl_str_mv |
bcuel@uel.br|| |
_version_ |
1809823293190963200 |