Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Detalhes bibliográficos
Autor(a) principal: Leandro Souza Costa
Data de Publicação: 2008
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-7L3P92
Resumo: Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.
id UFMG_fd8f466a3429a29f589db09c85c89e9a
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-7L3P92
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Wagner Meira JuniorSandra Aparecida de AmoMarcos Andre GoncalvesLeandro Souza Costa2019-08-12T09:51:39Z2019-08-12T09:51:39Z2008-04-16http://hdl.handle.net/1843/RVMR-7L3P92Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.Frequent pattern mining is one of the most exploited subjects in data mining, assuming a key role in numerous tasks that have the goal of finding patterns of interest in a given data set. However, most of the solutions proposed in this line of research still have not solved problems, many of them related to the explosion in the number of frequent patterns found in the data set. This happens because frequent patterns conform to the anti-monotony property, which says that if a pattern is frequent, all its sub-patterns are also. This way the solution, by having redundant information from patterns of low significance, does not add to the result information useful enough to justify its importance.This work presents a new methodology for obtaining patterns of interest in a data set that explores the concept of orthogonality - defined as the measure of how the elements of a set does not contribute with redundant information to the solution of a problem - and its application in associative classification, as a way to increase the effectiveness of a classifier, reducing the redundancy and ambiguity of the rules.Universidade Federal de Minas GeraisUFMGRecuperação de dados (Computação)ComputaçãoMineração de dados (Computação)ortogonalidadeclassificação associativamineração de dadosMineração de padrões frequentes ortogonais e sua aplicação em classificação associativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALleandrosouzacosta.pdfapplication/pdf900881https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdfe5b9d29bce7169c3e75db85f2c8d81a9MD51TEXTleandrosouzacosta.pdf.txtleandrosouzacosta.pdf.txtExtracted texttext/plain190847https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt860d894426acdcb83af7831e56dea1f2MD521843/RVMR-7L3P922019-11-14 16:35:28.7oai:repositorio.ufmg.br:1843/RVMR-7L3P92Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:35:28Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
spellingShingle Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
Leandro Souza Costa
ortogonalidade
classificação associativa
mineração de dados
Recuperação de dados (Computação)
Computação
Mineração de dados (Computação)
title_short Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_full Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_fullStr Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_full_unstemmed Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_sort Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
author Leandro Souza Costa
author_facet Leandro Souza Costa
author_role author
dc.contributor.advisor1.fl_str_mv Wagner Meira Junior
dc.contributor.referee1.fl_str_mv Sandra Aparecida de Amo
dc.contributor.referee2.fl_str_mv Marcos Andre Goncalves
dc.contributor.author.fl_str_mv Leandro Souza Costa
contributor_str_mv Wagner Meira Junior
Sandra Aparecida de Amo
Marcos Andre Goncalves
dc.subject.por.fl_str_mv ortogonalidade
classificação associativa
mineração de dados
topic ortogonalidade
classificação associativa
mineração de dados
Recuperação de dados (Computação)
Computação
Mineração de dados (Computação)
dc.subject.other.pt_BR.fl_str_mv Recuperação de dados (Computação)
Computação
Mineração de dados (Computação)
description Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.
publishDate 2008
dc.date.issued.fl_str_mv 2008-04-16
dc.date.accessioned.fl_str_mv 2019-08-12T09:51:39Z
dc.date.available.fl_str_mv 2019-08-12T09:51:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-7L3P92
url http://hdl.handle.net/1843/RVMR-7L3P92
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt
bitstream.checksum.fl_str_mv e5b9d29bce7169c3e75db85f2c8d81a9
860d894426acdcb83af7831e56dea1f2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1797971096389025792