Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos

Detalhes bibliográficos
Autor(a) principal: Renato Vimieiro
Data de Publicação: 2007
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/RVMR-78QQHK
Resumo: Este trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos.
id UFMG_dd4c6ab4f8d796feeee168914c4341f1
oai_identifier_str oai:repositorio.ufmg.br:1843/RVMR-78QQHK
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Newton Jose VieiraLuiz Enrique ZarateRodolfo Sergio F de ResendeRenato Vimieiro2019-08-14T09:38:57Z2019-08-14T09:38:57Z2007-02-16http://hdl.handle.net/1843/RVMR-78QQHKEste trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos.This work presents a comparative analysis of techniques for extracting rules from databases through Formal Concept Analysis (FCA). The rules considered here are sets of dependencies among attributes of databases. Specifically, the dependencies are: implications, functional dependencies, association rules and classification rules. Those rules are mainly sourcered in databases theory in which they have a fundamental role as a way of helping with the process of decisions' taken case of implications, association rules and classification rules and with normalizing logical models case of functional dependencies. The FCA has a mathematical structure especially adequate for helping in data analysis. Such analysis is done through concept lattices that represent data in a hierachical manner. So, the objective of this work is the analysis and the comparison of methods that use FCA for discovering dependencies among attributes of databases. It has been analyzed ten representative algorithm for extracting the four types of rules mentioned. From those algorithms, four are used in the extraction of functional dependencies and implications. They are: Next Closure, Find Implications, Impec and Aprem-IR. The last six algorithms are useful for extracting association and classification rules. Four algorithms have been analyzed for the extraction of association rules: AClose, Frequent Next Neighbours, Titanic and Galicia. Finally, two algorithms have been analyzed for the extraction of classification rules: GRAND and Rulearner. The algorithms have been implemented and submitted to real and synthetic databases. The databases have been chosen with two criteria: database's size (number of entries) and density. Those criteria try to eliminate a deficiency detected in the literature in choosing databases for algorithms' evaluation. One noted that those algorithms have characteristic behaviors for different databases. In this work, it is suggested the adequacy of each algorithm to databases with different densities and sizes.Universidade Federal de Minas GeraisUFMGSistemas de recuperação da informaçãoLogica simbolica e matematicaComputaçãoBanco de dadosComputação MatematicaMineração de dados (Computação)Teoria dos reticuladosalgoritmoslogica formalUm estudo de algoritmos para extração de regras baseados em análise formal de conceitosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALrenatovimieiro.pdfapplication/pdf1398653https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/1/renatovimieiro.pdf6fd29c61085162ff230b65fef7a48ecbMD51TEXTrenatovimieiro.pdf.txtrenatovimieiro.pdf.txtExtracted texttext/plain242483https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/2/renatovimieiro.pdf.txt88b8e0e561d1103662465cf0147b50aeMD521843/RVMR-78QQHK2019-11-14 17:16:40.516oai:repositorio.ufmg.br:1843/RVMR-78QQHKRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:16:40Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
title Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
spellingShingle Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
Renato Vimieiro
algoritmos
logica formal
Sistemas de recuperação da informação
Logica simbolica e matematica
Computação
Banco de dados
Computação Matematica
Mineração de dados (Computação)
Teoria dos reticulados
title_short Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
title_full Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
title_fullStr Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
title_full_unstemmed Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
title_sort Um estudo de algoritmos para extração de regras baseados em análise formal de conceitos
author Renato Vimieiro
author_facet Renato Vimieiro
author_role author
dc.contributor.advisor1.fl_str_mv Newton Jose Vieira
dc.contributor.referee1.fl_str_mv Luiz Enrique Zarate
dc.contributor.referee2.fl_str_mv Rodolfo Sergio F de Resende
dc.contributor.author.fl_str_mv Renato Vimieiro
contributor_str_mv Newton Jose Vieira
Luiz Enrique Zarate
Rodolfo Sergio F de Resende
dc.subject.por.fl_str_mv algoritmos
logica formal
topic algoritmos
logica formal
Sistemas de recuperação da informação
Logica simbolica e matematica
Computação
Banco de dados
Computação Matematica
Mineração de dados (Computação)
Teoria dos reticulados
dc.subject.other.pt_BR.fl_str_mv Sistemas de recuperação da informação
Logica simbolica e matematica
Computação
Banco de dados
Computação Matematica
Mineração de dados (Computação)
Teoria dos reticulados
description Este trabalho apresenta uma análise comparativa de técnicas para a extração de regras de bancos de dados através da Análise Formal de Conceitos (AFC). As regras consideradas aqui são conjuntos de dependências entre atributos de bancos de dados. Especificamente, as dependências são: implicações, dependências funcionais, regras de associação e regras de classificação. Essas regras são originárias, principalmente, da teoria dos bancos de dados, na qual desempenham papel fundamental para auxiliar processos de tomada de decisão caso das implicações, regras de associação e classificação e na normalização de modelos lógicos caso das dependências funcionais. A AFC, por sua vez, possui uma estrutura matemática especialmente adequada para auxiliar na análise de dados. Essa análise é feita através de reticulados conceituais que representam dados de forma hierárquica. Sendo assim, o objetivo do trabalho é analisar e comparar métodos que utilizem a AFC para a descoberta de dependências entre atributos em bancos de dados. São analisados dez algoritmos representativos para extração dos quatro tipos de regras mencionados. Desses algoritmos, quatro são usados na identificação de dependências funcionais e implicações. São eles: Next Closure, Find Implications, Impec e Aprem-IR. Os seis algoritmos restantes são úteis na identificação de regras de associação e de classificação. Foram analisados quatro algoritmos para extrair regras de associação: AClose, Frequent Next Neighbours, Titanic e Galicia. Finalmente, foram analisados dois algoritmos para identificar regras de classificação: GRAND e Rulearner.Os algoritmos foram implementados e submetidos a bancos de dados reais e sintéticos.Os bancos de dados foram escolhidos e gerados segundo dois critérios: tamanho da base de dados (número de entradas) e densidade. Esses dois critérios tentam suprir a deficiência constatada na literatura no que diz respeito à escolha de bancos de dados para avaliação de algoritmos. Constatou-se que os algoritmos apresentam comportamentos característicos para diferentes bancos de dados. Neste trabalho, é sugerida a adequação de cada algoritmo aos bancos de dados com diferentes densidades e tamanhos.
publishDate 2007
dc.date.issued.fl_str_mv 2007-02-16
dc.date.accessioned.fl_str_mv 2019-08-14T09:38:57Z
dc.date.available.fl_str_mv 2019-08-14T09:38:57Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/RVMR-78QQHK
url http://hdl.handle.net/1843/RVMR-78QQHK
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/1/renatovimieiro.pdf
https://repositorio.ufmg.br/bitstream/1843/RVMR-78QQHK/2/renatovimieiro.pdf.txt
bitstream.checksum.fl_str_mv 6fd29c61085162ff230b65fef7a48ecb
88b8e0e561d1103662465cf0147b50ae
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589153695203328