Algoritmos de mineração de dados eficiente quanto ao consumo de memória

Gustavo Menezes Siqueira

Algoritmos de mineração de dados eficiente quanto ao consumo de memória

Detalhes bibliográficos
Autor(a) principal:	Gustavo Menezes Siqueira
Data de Publicação:	2004
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/SLBS-643J9H
Resumo:	A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.

Metadados do item

id	UFMG_9a290b3d47f91110deb17afab9b637ab
oai_identifier_str	oai:repositorio.ufmg.br:1843/SLBS-643J9H
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Wagner Meira JuniorEdleno Silva de MouraMárcio Luiz Bunte de CarvalhoNivio ZivianiGustavo Menezes Siqueira2019-08-09T16:14:56Z2019-08-09T16:14:56Z2004-07-16http://hdl.handle.net/1843/SLBS-643J9HA quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.The volume of data input to data mining applications has grown considerably as an indirect consequence of the price reductions for data aquisition, transmission and storage. Thus, data mining applications must be scalable, that is, the losses in performance should be small when the size of the input is increased. Frequent itemset mining is a popular data mining application for which there are several algorithms and implementations. EClaT is among the most successful and wellknown algorithms. Its most memory consuming abstract data type is the natural number set. In this work, we replaced the implementation for this abstract data type for another, commonly employed by information retrieval algorithms but never before employed by data mining algorithms, that saves memory. We adapted to the new context and/or implemented other memory saving techniques as well. We achived an economy in maximum memory consumption of up to an order of magnitude compared to the original implementation.Universidade Federal de Minas GeraisUFMGComputaçãoMineração de dados (Computação)AlgoritmosMineração de dadosAlgoritmos de mineração de dados eficiente quanto ao consumo de memóriainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALgustavomenezessiqueira.pdfapplication/pdf5388989https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf5593f2332546aeca20e823785e2c2a45MD51TEXTgustavomenezessiqueira.pdf.txtgustavomenezessiqueira.pdf.txtExtracted texttext/plain146477https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt71498d42d6b718dc50a73a4cc047fcecMD521843/SLBS-643J9H2019-11-14 08:08:51.719oai:repositorio.ufmg.br:1843/SLBS-643J9HRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T11:08:51Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
spellingShingle	Algoritmos de mineração de dados eficiente quanto ao consumo de memória Gustavo Menezes Siqueira Algoritmos Mineração de dados Computação Mineração de dados (Computação)
title_short	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_full	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_fullStr	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_full_unstemmed	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
title_sort	Algoritmos de mineração de dados eficiente quanto ao consumo de memória
author	Gustavo Menezes Siqueira
author_facet	Gustavo Menezes Siqueira
author_role	author
dc.contributor.advisor1.fl_str_mv	Wagner Meira Junior
dc.contributor.referee1.fl_str_mv	Edleno Silva de Moura
dc.contributor.referee2.fl_str_mv	Márcio Luiz Bunte de Carvalho
dc.contributor.referee3.fl_str_mv	Nivio Ziviani
dc.contributor.author.fl_str_mv	Gustavo Menezes Siqueira
contributor_str_mv	Wagner Meira Junior Edleno Silva de Moura Márcio Luiz Bunte de Carvalho Nivio Ziviani
dc.subject.por.fl_str_mv	Algoritmos Mineração de dados
topic	Algoritmos Mineração de dados Computação Mineração de dados (Computação)
dc.subject.other.pt_BR.fl_str_mv	Computação Mineração de dados (Computação)
description	A quantidade de dados submetida às aplicações de mineração de dados tem crescido consideravelmente como conseqüência indireta das reduções dos custos de coleta, transmissão e armazenamento de dados. Portanto, as aplicações de mineração de dados devem ser escaláveis, isto é, as perdas em desempenho devem ser pequenas com o aumento do tamanho da entrada. A mineração de conjuntos freqüentes é uma aplicação popular de mineração de dados para a qual há diversos algoritmos e implementações. O EClaT está entre os algoritmos mais bem-sucedidos e conhecidos. Seu tipo abstrato de dados que mais consome memória é o conjunto de números naturais. Nesse trabalho, substituímos a implementação desse tipo abstrato de dados por outra, comumente empregada por algoritmos de recuperação de informação mas nunca antes empregada por algoritmos de mineração de dados, que economiza memória. Também adaptamos para o novo contexto e/ou implementamos outras estratégias de economia de memória. Obtivemos economia do consumo máximo de memória de até uma ordem de magnitude em relação à implementação original.
publishDate	2004
dc.date.issued.fl_str_mv	2004-07-16
dc.date.accessioned.fl_str_mv	2019-08-09T16:14:56Z
dc.date.available.fl_str_mv	2019-08-09T16:14:56Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/SLBS-643J9H
url	http://hdl.handle.net/1843/SLBS-643J9H
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/1/gustavomenezessiqueira.pdf https://repositorio.ufmg.br/bitstream/1843/SLBS-643J9H/2/gustavomenezessiqueira.pdf.txt
bitstream.checksum.fl_str_mv	5593f2332546aeca20e823785e2c2a45 71498d42d6b718dc50a73a4cc047fcec
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1801676686390984704

Algoritmos de mineração de dados eficiente quanto ao consumo de memória

Registros relacionados