Algoritmos de mineração de dados eficiente quanto ao consumo de memória

Detalhes bibliográficos
Autor(a) principal: Gustavo Menezes Siqueira
Data de Publicação: 2004
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLBS-643J9H
Resumo: A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.
id UFMG_9a290b3d47f91110deb17afab9b637ab
oai_identifier_str oai:repositorio.ufmg.br:1843/SLBS-643J9H
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Wagner Meira JuniorEdleno Silva de MouraMárcio Luiz Bunte de CarvalhoNivio ZivianiGustavo Menezes Siqueira2019-08-09T16:14:56Z2019-08-09T16:14:56Z2004-07-16http://hdl.handle.net/1843/SLBS-643J9HA quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.The volume of data input to data mining applications has grown considerably as an indirect consequence of the price reductions for data aquisition, transmission and storage. Thus, data mining applications must be scalable, that is, the losses in performance should be small when the size of the input is increased. Frequent itemset mining is a popular data mining application for which there are several algorithms and implementations. EClaT is among the most successful and wellknown algorithms. Its most memory consuming abstract data type is the natural number set. In this work, we replaced the implementation for this abstract data type for another, commonly employed by information retrieval algorithms but never before employed by data mining algorithms, that saves memory. We adapted to the new context and/or implemented other memory saving techniques as well. We achived an economy in maximum memory consumption of up to an order of magnitude compared to the original implementation.Universidade Federal de Minas GeraisUFMGComputaçãoMineração de dados (Computação)AlgoritmosMineração de dadosAlgoritmos de mineração de dados eficiente quanto ao consumo de memóriainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALgustavomenezessiqueira.pdfapplication/pdf5388989https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf5593f2332546aeca20e823785e2c2a45MD51TEXTgustavomenezessiqueira.pdf.txtgustavomenezessiqueira.pdf.txtExtracted texttext/plain146477https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt71498d42d6b718dc50a73a4cc047fcecMD521843/SLBS-643J9H2019-11-14 08:08:51.719oai:repositorio.ufmg.br:1843/SLBS-643J9HRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T11:08:51Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title Algoritmos de mineração de dados eficiente quanto ao consumo de memória
spellingShingle Algoritmos de mineração de dados eficiente quanto ao consumo de memória
Gustavo Menezes Siqueira
Algoritmos
Mineração de dados
Computação
Mineração de dados (Computação)
title_short Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_full Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_fullStr Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_full_unstemmed Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_sort Algoritmos de mineração de dados eficiente quanto ao consumo de memória
author Gustavo Menezes Siqueira
author_facet Gustavo Menezes Siqueira
author_role author
dc.contributor.advisor1.fl_str_mv Wagner Meira Junior
dc.contributor.referee1.fl_str_mv Edleno Silva de Moura
dc.contributor.referee2.fl_str_mv Márcio Luiz Bunte de Carvalho
dc.contributor.referee3.fl_str_mv Nivio Ziviani
dc.contributor.author.fl_str_mv Gustavo Menezes Siqueira
contributor_str_mv Wagner Meira Junior
Edleno Silva de Moura
Márcio Luiz Bunte de Carvalho
Nivio Ziviani
dc.subject.por.fl_str_mv Algoritmos
Mineração de dados
topic Algoritmos
Mineração de dados
Computação
Mineração de dados (Computação)
dc.subject.other.pt_BR.fl_str_mv Computação
Mineração de dados (Computação)
description A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.
publishDate 2004
dc.date.issued.fl_str_mv 2004-07-16
dc.date.accessioned.fl_str_mv 2019-08-09T16:14:56Z
dc.date.available.fl_str_mv 2019-08-09T16:14:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLBS-643J9H
url http://hdl.handle.net/1843/SLBS-643J9H
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf
https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt
bitstream.checksum.fl_str_mv 5593f2332546aeca20e823785e2c2a45
71498d42d6b718dc50a73a4cc047fcec
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676686390984704