Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/RVMR-7L3P92 |
Resumo: | Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras. |
id |
UFMG_fd8f466a3429a29f589db09c85c89e9a |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/RVMR-7L3P92 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Wagner Meira JuniorSandra Aparecida de AmoMarcos Andre GoncalvesLeandro Souza Costa2019-08-12T09:51:39Z2019-08-12T09:51:39Z2008-04-16http://hdl.handle.net/1843/RVMR-7L3P92Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.Frequent pattern mining is one of the most exploited subjects in data mining, assuming a key role in numerous tasks that have the goal of finding patterns of interest in a given data set. However, most of the solutions proposed in this line of research still have not solved problems, many of them related to the explosion in the number of frequent patterns found in the data set. This happens because frequent patterns conform to the anti-monotony property, which says that if a pattern is frequent, all its sub-patterns are also. This way the solution, by having redundant information from patterns of low significance, does not add to the result information useful enough to justify its importance.This work presents a new methodology for obtaining patterns of interest in a data set that explores the concept of orthogonality - defined as the measure of how the elements of a set does not contribute with redundant information to the solution of a problem - and its application in associative classification, as a way to increase the effectiveness of a classifier, reducing the redundancy and ambiguity of the rules.Universidade Federal de Minas GeraisUFMGRecuperação de dados (Computação)ComputaçãoMineração de dados (Computação)ortogonalidadeclassificação associativamineração de dadosMineração de padrões frequentes ortogonais e sua aplicação em classificação associativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALleandrosouzacosta.pdfapplication/pdf900881https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdfe5b9d29bce7169c3e75db85f2c8d81a9MD51TEXTleandrosouzacosta.pdf.txtleandrosouzacosta.pdf.txtExtracted texttext/plain190847https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt860d894426acdcb83af7831e56dea1f2MD521843/RVMR-7L3P922019-11-14 16:35:28.7oai:repositorio.ufmg.br:1843/RVMR-7L3P92Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:35:28Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
title |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
spellingShingle |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa Leandro Souza Costa ortogonalidade classificação associativa mineração de dados Recuperação de dados (Computação) Computação Mineração de dados (Computação) |
title_short |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
title_full |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
title_fullStr |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
title_full_unstemmed |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
title_sort |
Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa |
author |
Leandro Souza Costa |
author_facet |
Leandro Souza Costa |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Wagner Meira Junior |
dc.contributor.referee1.fl_str_mv |
Sandra Aparecida de Amo |
dc.contributor.referee2.fl_str_mv |
Marcos Andre Goncalves |
dc.contributor.author.fl_str_mv |
Leandro Souza Costa |
contributor_str_mv |
Wagner Meira Junior Sandra Aparecida de Amo Marcos Andre Goncalves |
dc.subject.por.fl_str_mv |
ortogonalidade classificação associativa mineração de dados |
topic |
ortogonalidade classificação associativa mineração de dados Recuperação de dados (Computação) Computação Mineração de dados (Computação) |
dc.subject.other.pt_BR.fl_str_mv |
Recuperação de dados (Computação) Computação Mineração de dados (Computação) |
description |
Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras. |
publishDate |
2008 |
dc.date.issued.fl_str_mv |
2008-04-16 |
dc.date.accessioned.fl_str_mv |
2019-08-12T09:51:39Z |
dc.date.available.fl_str_mv |
2019-08-12T09:51:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/RVMR-7L3P92 |
url |
http://hdl.handle.net/1843/RVMR-7L3P92 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt |
bitstream.checksum.fl_str_mv |
e5b9d29bce7169c3e75db85f2c8d81a9 860d894426acdcb83af7831e56dea1f2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1801676789785821184 |