Algoritmos de mineração de dados eficiente quanto ao consumo de memória
Autor(a) principal: | |
---|---|
Data de Publicação: | 2004 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/SLBS-643J9H |
Resumo: | A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original. |
id |
UFMG_9a290b3d47f91110deb17afab9b637ab |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/SLBS-643J9H |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Wagner Meira JuniorEdleno Silva de MouraMárcio Luiz Bunte de CarvalhoNivio ZivianiGustavo Menezes Siqueira2019-08-09T16:14:56Z2019-08-09T16:14:56Z2004-07-16http://hdl.handle.net/1843/SLBS-643J9HA quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.The volume of data input to data mining applications has grown considerably as an indirect consequence of the price reductions for data aquisition, transmission and storage. Thus, data mining applications must be scalable, that is, the losses in performance should be small when the size of the input is increased. Frequent itemset mining is a popular data mining application for which there are several algorithms and implementations. EClaT is among the most successful and wellknown algorithms. Its most memory consuming abstract data type is the natural number set. In this work, we replaced the implementation for this abstract data type for another, commonly employed by information retrieval algorithms but never before employed by data mining algorithms, that saves memory. We adapted to the new context and/or implemented other memory saving techniques as well. We achived an economy in maximum memory consumption of up to an order of magnitude compared to the original implementation.Universidade Federal de Minas GeraisUFMGComputaçãoMineração de dados (Computação)AlgoritmosMineração de dadosAlgoritmos de mineração de dados eficiente quanto ao consumo de memóriainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALgustavomenezessiqueira.pdfapplication/pdf5388989https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf5593f2332546aeca20e823785e2c2a45MD51TEXTgustavomenezessiqueira.pdf.txtgustavomenezessiqueira.pdf.txtExtracted texttext/plain146477https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt71498d42d6b718dc50a73a4cc047fcecMD521843/SLBS-643J9H2019-11-14 08:08:51.719oai:repositorio.ufmg.br:1843/SLBS-643J9HRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T11:08:51Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
title |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
spellingShingle |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória Gustavo Menezes Siqueira Algoritmos Mineração de dados Computação Mineração de dados (Computação) |
title_short |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
title_full |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
title_fullStr |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
title_full_unstemmed |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
title_sort |
Algoritmos de mineração de dados eficiente quanto ao consumo de memória |
author |
Gustavo Menezes Siqueira |
author_facet |
Gustavo Menezes Siqueira |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Wagner Meira Junior |
dc.contributor.referee1.fl_str_mv |
Edleno Silva de Moura |
dc.contributor.referee2.fl_str_mv |
Márcio Luiz Bunte de Carvalho |
dc.contributor.referee3.fl_str_mv |
Nivio Ziviani |
dc.contributor.author.fl_str_mv |
Gustavo Menezes Siqueira |
contributor_str_mv |
Wagner Meira Junior Edleno Silva de Moura Márcio Luiz Bunte de Carvalho Nivio Ziviani |
dc.subject.por.fl_str_mv |
Algoritmos Mineração de dados |
topic |
Algoritmos Mineração de dados Computação Mineração de dados (Computação) |
dc.subject.other.pt_BR.fl_str_mv |
Computação Mineração de dados (Computação) |
description |
A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original. |
publishDate |
2004 |
dc.date.issued.fl_str_mv |
2004-07-16 |
dc.date.accessioned.fl_str_mv |
2019-08-09T16:14:56Z |
dc.date.available.fl_str_mv |
2019-08-09T16:14:56Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/SLBS-643J9H |
url |
http://hdl.handle.net/1843/SLBS-643J9H |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt |
bitstream.checksum.fl_str_mv |
5593f2332546aeca20e823785e2c2a45 71498d42d6b718dc50a73a4cc047fcec |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1801676686390984704 |