Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos

Detalhes bibliográficos
Autor(a) principal: Burkle, Paula Yamada
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: https://app.uff.br/riuff/handle/1/17895
Resumo: Data mining is a process that aims at knowledge discovery from within great extension databases. Although it has been increasingly adopted due to its good performance in several domains, in some cases the results that are generated may be too large or too complex. This is a problem that is specific to the Association Rules technique, which often generates an amount of rules that exceed the limit amount of rules that are humanly viable to manipulate. In this present paper we propose a new semantic pruning approach for association rules based on previous domain knowledge, which is represented by attribute inter-dependency relations. The proposed method is aimed at facilitating analysis and comprehension of the rules, by means of eliminating redundancy within the mined rules, and by selecting those that have greater impact for the user s needs. Among the main results of the present study is the proposal and implementation of the DMcut association rules pruning method. The experiments that were conducted on four public domain databases reveal the potential benefits of using the method.
id UFF-2_f58329fa3f0df8062cf3b09edce08314
oai_identifier_str oai:app.uff.br:1/17895
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributosCiência da computaçãoProcesso de mineração de dadosAlgoritmo de mineração de regras de associaçãoOtimização combinatória (Computação)Inteligência artificialData miningAssociation rulesPost-processingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAOData mining is a process that aims at knowledge discovery from within great extension databases. Although it has been increasingly adopted due to its good performance in several domains, in some cases the results that are generated may be too large or too complex. This is a problem that is specific to the Association Rules technique, which often generates an amount of rules that exceed the limit amount of rules that are humanly viable to manipulate. In this present paper we propose a new semantic pruning approach for association rules based on previous domain knowledge, which is represented by attribute inter-dependency relations. The proposed method is aimed at facilitating analysis and comprehension of the rules, by means of eliminating redundancy within the mined rules, and by selecting those that have greater impact for the user s needs. Among the main results of the present study is the proposal and implementation of the DMcut association rules pruning method. The experiments that were conducted on four public domain databases reveal the potential benefits of using the method.A Mineração de Dados tem como objetivo a descoberta de conhecimento a partir de bases de dados de grandes dimensões. Apesar desse processo ter despontado por seu desempenho em diversos domínios, em alguns casos o resultado gerado pode ser muito grande ou muito complexo. Este é um problema em específico da técnica de Regras de Associação, na qual o número de regras geradas muitas vezes ultrapassa o limite de regras humanamente manipulável. Neste trabalho propomos uma nova abordagem de poda semântica de regras de associação, baseada no uso do conhecimento prévio do domínio, representado pelas relações de dependência entre os atributos. O método proposto tem como objetivo facilitar a análise e interpretação das regras de associação, eliminando a redundância das regras mineradas, e selecionando aquelas de maior impacto para o usuário. Dentre os principais resultados deste trabalho destacam-se a proposta e implementação do método de poda de regras de associação DMcut. Os experimentos realizados sobre quatro bases de dados de domínio público mostram os potenciais benefícios de sua utilização.Programa de Pós-Graduação em ComputaçãoComputaçãoGarcia, Ana Cristina BicharraCPF:31237899422http://lattes.cnpq.br/4879977915136752Varejão, Flavio MiguelCPF:31349085222http://lattes.cnpq.br/6501574961643171Ochi, Luiz SatoruCPF:31609080822http://lattes.cnpq.br/9171815778534257Burkle, Paula Yamada2021-03-10T20:43:02Z2008-06-132021-03-10T20:43:02Z2006-10-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://app.uff.br/riuff/handle/1/17895porCC-BY-SAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-03-10T20:43:02Zoai:app.uff.br:1/17895Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:09:20.689449Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
title Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
spellingShingle Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
Burkle, Paula Yamada
Ciência da computação
Processo de mineração de dados
Algoritmo de mineração de regras de associação
Otimização combinatória (Computação)
Inteligência artificial
Data mining
Association rules
Post-processing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
title_short Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
title_full Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
title_fullStr Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
title_full_unstemmed Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
title_sort Um método de pós-processamento de regras de associação com base nas relações de dependência entre os atributos
author Burkle, Paula Yamada
author_facet Burkle, Paula Yamada
author_role author
dc.contributor.none.fl_str_mv Garcia, Ana Cristina Bicharra
CPF:31237899422
http://lattes.cnpq.br/4879977915136752
Varejão, Flavio Miguel
CPF:31349085222
http://lattes.cnpq.br/6501574961643171
Ochi, Luiz Satoru
CPF:31609080822
http://lattes.cnpq.br/9171815778534257
dc.contributor.author.fl_str_mv Burkle, Paula Yamada
dc.subject.por.fl_str_mv Ciência da computação
Processo de mineração de dados
Algoritmo de mineração de regras de associação
Otimização combinatória (Computação)
Inteligência artificial
Data mining
Association rules
Post-processing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
topic Ciência da computação
Processo de mineração de dados
Algoritmo de mineração de regras de associação
Otimização combinatória (Computação)
Inteligência artificial
Data mining
Association rules
Post-processing
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
description Data mining is a process that aims at knowledge discovery from within great extension databases. Although it has been increasingly adopted due to its good performance in several domains, in some cases the results that are generated may be too large or too complex. This is a problem that is specific to the Association Rules technique, which often generates an amount of rules that exceed the limit amount of rules that are humanly viable to manipulate. In this present paper we propose a new semantic pruning approach for association rules based on previous domain knowledge, which is represented by attribute inter-dependency relations. The proposed method is aimed at facilitating analysis and comprehension of the rules, by means of eliminating redundancy within the mined rules, and by selecting those that have greater impact for the user s needs. Among the main results of the present study is the proposal and implementation of the DMcut association rules pruning method. The experiments that were conducted on four public domain databases reveal the potential benefits of using the method.
publishDate 2006
dc.date.none.fl_str_mv 2006-10-05
2008-06-13
2021-03-10T20:43:02Z
2021-03-10T20:43:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://app.uff.br/riuff/handle/1/17895
url https://app.uff.br/riuff/handle/1/17895
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Programa de Pós-Graduação em Computação
Computação
publisher.none.fl_str_mv Programa de Pós-Graduação em Computação
Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823674851852288