Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2007 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/RVMR-78QQHK |
Resumo: | Este trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos. |
id |
UFMG_dd4c6ab4f8d796feeee168914c4341f1 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/RVMR-78QQHK |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Newton Jose VieiraLuiz Enrique ZarateRodolfo Sergio F de ResendeRenato Vimieiro2019-08-14T09:38:57Z2019-08-14T09:38:57Z2007-02-16http://hdl.handle.net/1843/RVMR-78QQHKEste trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos.This work presents a comparative analysis of techniques for extracting rules from databases through Formal Concept Analysis (FCA). The rules considered here are sets of dependencies among attributes of databases. Specifically, the dependencies are: implications, functional dependencies, association rules and classification rules. Those rules are mainly sourcered in databases theory in which they have a fundamental role as a way of helping with the process of decisions' taken case of implications, association rules and classification rules and with normalizing logical models case of functional dependencies. The FCA has a mathematical structure especially adequate for helping in data analysis. Such analysis is done through concept lattices that represent data in a hierachical manner. So, the objective of this work is the analysis and the comparison of methods that use FCA for discovering dependencies among attributes of databases. It has been analyzed ten representative algorithm for extracting the four types of rules mentioned. From those algorithms, four are used in the extraction of functional dependencies and implications. They are: Next Closure, Find Implications, Impec and Aprem-IR. The last six algorithms are useful for extracting association and classification rules. Four algorithms have been analyzed for the extraction of association rules: AClose, Frequent Next Neighbours, Titanic and Galicia. Finally, two algorithms have been analyzed for the extraction of classification rules: GRAND and Rulearner. The algorithms have been implemented and submitted to real and synthetic databases. The databases have been chosen with two criteria: database's size (number of entries) and density. Those criteria try to eliminate a deficiency detected in the literature in choosing databases for algorithms' evaluation. One noted that those algorithms have characteristic behaviors for different databases. In this work, it is suggested the adequacy of each algorithm to databases with different densities and sizes.Universidade Federal de Minas GeraisUFMGSistemas de recuperação da informaçãoLogica simbolica e matematicaComputaçãoBanco de dadosComputação MatematicaMineração de dados (Computação)Teoria dos reticuladosalgoritmoslogica formalUm estudo de algoritmos para extração de regras baseados em análise formal de conceitosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALrenatovimieiro.pdfapplication/pdf1398653https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/1/renatovimieiro.pdf6fd29c61085162ff230b65fef7a48ecbMD51TEXTrenatovimieiro.pdf.txtrenatovimieiro.pdf.txtExtracted texttext/plain242483https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/2/renatovimieiro.pdf.txt88b8e0e561d1103662465cf0147b50aeMD521843/RVMR-78QQHK2019-11-14 17:16:40.516oai:repositorio.ufmg.br:1843/RVMR-78QQHKRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:16:40Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
title |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
spellingShingle |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos Renato Vimieiro algoritmos logica formal Sistemas de recuperação da informação Logica simbolica e matematica Computação Banco de dados Computação Matematica Mineração de dados (Computação) Teoria dos reticulados |
title_short |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
title_full |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
title_fullStr |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
title_full_unstemmed |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
title_sort |
Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos |
author |
Renato Vimieiro |
author_facet |
Renato Vimieiro |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Newton Jose Vieira |
dc.contributor.referee1.fl_str_mv |
Luiz Enrique Zarate |
dc.contributor.referee2.fl_str_mv |
Rodolfo Sergio F de Resende |
dc.contributor.author.fl_str_mv |
Renato Vimieiro |
contributor_str_mv |
Newton Jose Vieira Luiz Enrique Zarate Rodolfo Sergio F de Resende |
dc.subject.por.fl_str_mv |
algoritmos logica formal |
topic |
algoritmos logica formal Sistemas de recuperação da informação Logica simbolica e matematica Computação Banco de dados Computação Matematica Mineração de dados (Computação) Teoria dos reticulados |
dc.subject.other.pt_BR.fl_str_mv |
Sistemas de recuperação da informação Logica simbolica e matematica Computação Banco de dados Computação Matematica Mineração de dados (Computação) Teoria dos reticulados |
description |
Este trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos. |
publishDate |
2007 |
dc.date.issued.fl_str_mv |
2007-02-16 |
dc.date.accessioned.fl_str_mv |
2019-08-14T09:38:57Z |
dc.date.available.fl_str_mv |
2019-08-14T09:38:57Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/RVMR-78QQHK |
url |
http://hdl.handle.net/1843/RVMR-78QQHK |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/1/renatovimieiro.pdf https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/2/renatovimieiro.pdf.txt |
bitstream.checksum.fl_str_mv |
6fd29c61085162ff230b65fef7a48ecb 88b8e0e561d1103662465cf0147b50ae |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589153695203328 |