Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Leandro Souza Costa

Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Detalhes bibliográficos
Autor(a) principal:	Leandro Souza Costa
Data de Publicação:	2008
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/RVMR-7L3P92
Resumo:	Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.

Metadados do item

id	UFMG_fd8f466a3429a29f589db09c85c89e9a
oai_identifier_str	oai:repositorio.ufmg.br:1843/RVMR-7L3P92
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Wagner Meira JuniorSandra Aparecida de AmoMarcos Andre GoncalvesLeandro Souza Costa2019-08-12T09:51:39Z2019-08-12T09:51:39Z2008-04-16http://hdl.handle.net/1843/RVMR-7L3P92Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.Frequent pattern mining is one of the most exploited subjects in data mining, assuming a key role in numerous tasks that have the goal of finding patterns of interest in a given data set. However, most of the solutions proposed in this line of research still have not solved problems, many of them related to the explosion in the number of frequent patterns found in the data set. This happens because frequent patterns conform to the anti-monotony property, which says that if a pattern is frequent, all its sub-patterns are also. This way the solution, by having redundant information from patterns of low significance, does not add to the result information useful enough to justify its importance.This work presents a new methodology for obtaining patterns of interest in a data set that explores the concept of orthogonality - defined as the measure of how the elements of a set does not contribute with redundant information to the solution of a problem - and its application in associative classification, as a way to increase the effectiveness of a classifier, reducing the redundancy and ambiguity of the rules.Universidade Federal de Minas GeraisUFMGRecuperação de dados (Computação)ComputaçãoMineração de dados (Computação)ortogonalidadeclassificação associativamineração de dadosMineração de padrões frequentes ortogonais e sua aplicação em classificação associativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALleandrosouzacosta.pdfapplication/pdf900881https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdfe5b9d29bce7169c3e75db85f2c8d81a9MD51TEXTleandrosouzacosta.pdf.txtleandrosouzacosta.pdf.txtExtracted texttext/plain190847https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt860d894426acdcb83af7831e56dea1f2MD521843/RVMR-7L3P922019-11-14 16:35:28.7oai:repositorio.ufmg.br:1843/RVMR-7L3P92Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:35:28Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
spellingShingle	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa Leandro Souza Costa ortogonalidade classificação associativa mineração de dados Recuperação de dados (Computação) Computação Mineração de dados (Computação)
title_short	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_full	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_fullStr	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_full_unstemmed	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
title_sort	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
author	Leandro Souza Costa
author_facet	Leandro Souza Costa
author_role	author
dc.contributor.advisor1.fl_str_mv	Wagner Meira Junior
dc.contributor.referee1.fl_str_mv	Sandra Aparecida de Amo
dc.contributor.referee2.fl_str_mv	Marcos Andre Goncalves
dc.contributor.author.fl_str_mv	Leandro Souza Costa
contributor_str_mv	Wagner Meira Junior Sandra Aparecida de Amo Marcos Andre Goncalves
dc.subject.por.fl_str_mv	ortogonalidade classificação associativa mineração de dados
topic	ortogonalidade classificação associativa mineração de dados Recuperação de dados (Computação) Computação Mineração de dados (Computação)
dc.subject.other.pt_BR.fl_str_mv	Recuperação de dados (Computação) Computação Mineração de dados (Computação)
description	Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.
publishDate	2008
dc.date.issued.fl_str_mv	2008-04-16
dc.date.accessioned.fl_str_mv	2019-08-12T09:51:39Z
dc.date.available.fl_str_mv	2019-08-12T09:51:39Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/RVMR-7L3P92
url	http://hdl.handle.net/1843/RVMR-7L3P92
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/1/leandrosouzacosta.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-7L3P92/2/leandrosouzacosta.pdf.txt
bitstream.checksum.fl_str_mv	e5b9d29bce7169c3e75db85f2c8d81a9 860d894426acdcb83af7831e56dea1f2
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1801676789785821184

Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Registros relacionados