Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional

Detalhes bibliográficos
Autor(a) principal: Duarte, Denio
Data de Publicação: 2001
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/34156
Resumo: Orientadora : Silvia Regina Vergilio
id UFPR_fcc4fce068bb532fc9cd7eed477a8e11
oai_identifier_str oai:acervodigital.ufpr.br:1884/34156
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Ramirez Pozo, Aurora Trinidad, 1959-Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaVergilio, Silvia Regina, 1966-Duarte, Denio2024-03-28T17:27:09Z2024-03-28T17:27:09Z2001https://hdl.handle.net/1884/34156Orientadora : Silvia Regina VergilioCoorientadora : Aurora T. R. PozoDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em InformáticaResumo: As empresas estão sendo sobrecarregadas rapidamente com grandes volumes de dados e ao mesmo tempo estão se tornando, predominantemente, orientadas ao conhecimento. O aumento do domínio do conhecimento não melhora apenas os produtos, mas também é uma fonte para decisões estratégicas. Do ponto de vista da ciência da computação, os requisitos de conhecimento exigidos pelas empresas sempre dão mais ênfase a "conhecer que" (conhecimento declarativo) do que "conhecer como" (conhecimento procedural). A lógica matemática tem sido a representação preferida para o conhecimento declarativo e portanto, técnicas de descoberta do conhecimento são utilizadas, as quais geram fórmulas lógicas a partir dos dados. Programas lógicos oferecem uma representação poderosa e flexível para restrições, gramáticas, equações e relacionamentos temporais e espaciais. A técnica que induz conceitos a partir de dados gerando programas lógicos é chamada de Programação Lógica Indutiva (ILP - Inductive Logic Programming). Este trabalho descreve a implementação de um sistema para a descoberta do conhecimento (mineração de dados) em bancos de dados relacionais utilizando fundamentos de ILP e SQL. Esse sistema, DBILP (DataBase miner based on ILP), trabalha com dois mecanismos básicos: um que, baseado em ILP, especializa e, em seguida, generaliza as regras construídas, e outro que instância e valida essas regras, baseado em comandos SQL. ILP e SQL foram escolhidos pois o primeiro é uma técnica relativamente moderna e expressiva para a mineração de dados, e o segundo permite que grande volume de dados sejam manipulados, graças ao controle feito por um Sistema Gerenciador de Banco de Dados (SGBD). O funcionamento do DBILP é discutido ao longo desse trabalho, apresentando os módulos que o compõe, a sintaxe da linguagem de entrada definida, e a forma que as regras são construídas dentro do espaço de busca. A eficiência do DBILP é apresentada através de um experimento utilizando três outros sistemas bem conceituados no meio acadêmico, dois orientados a atributo-valor: C4.5 e CN2; e um sistema ILP: Progol. A análise desse experimento indica que o DBILP é particularmente útil no processo de descoberta do conhecimento em banco de dados (KDD - Knowledge Discovery in Databases).Abstract: Industry is increasingly overwhelmed by large-volume-data. Industry is also becoming predominantly knowledge driven. Increased understanding not only improves products, but strategic decision making. From Computer Science point of view, the knowledge requirements within industry often give higher emphasis to "knowing that" (declarative knowledge) rather than "knowing how" (procedural knowledge). Mathematical logic has always been the preferred representation for declarative knowledge and thus knowledge discovery techniques are required which generate logical formulae from data. Logic programs provide a powerful and flexible representation for constraints, grammars, equations and temporal and spatial relationships. The technique that induces concepts from data building logic programs is called Inductive Logic Programming (ILP). This work describes a system implementation for knowledge discovery (data mining) in relational databases using ILP e SQL techniques. This system, DBILP (DataBase miner based on ILP) works with two basic engines: the first one, based on ILP, specializes and, afterwards, generalizes the built rules; the second one grounds and validates those rules, using SQL statements. ILP and SQL were chosen because the former is a new and expressive technique to mine data and the latter allows DBILP to work with a large data volume, since Database Management Systems (DBMS) controls data access and manipulation. Throughout this work DBILP mecanisms are described, its modules presented, input language sintax defined, and the way the system builds the rules in search space is described. DBILP's effectiveness is shown by an experiment using three well-known systems, two attribute-value oriented: C4.5 and CN2; and a ILP system: Progol. The experiment analysis points out that DBILP is particularly well suited for Knowledge Discovery in Databases (KDD) tasks.78p. : il., grafs., tabs.application/pdfDisponível em formato digitalBanco de dados relacionaisProgramação logicaCiência da ComputaçãoUtilizando técnicas de programação lógica indutiva para mineração de banco de dados relacionalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - DENIO DUARTE.pdfapplication/pdf411533https://acervodigital.ufpr.br/bitstream/1884/34156/1/R%20-%20D%20-%20DENIO%20DUARTE.pdf39ebc218a6755f65d5c9841540ba2470MD51open accessTEXTR - D - DENIO DUARTE.pdf.txtExtracted Texttext/plain167709https://acervodigital.ufpr.br/bitstream/1884/34156/2/R%20-%20D%20-%20DENIO%20DUARTE.pdf.txt6e795b0337921a9a3bfc62fb296c0bd1MD52open accessTHUMBNAILR - D - DENIO DUARTE.pdf.jpgGenerated Thumbnailimage/jpeg1136https://acervodigital.ufpr.br/bitstream/1884/34156/3/R%20-%20D%20-%20DENIO%20DUARTE.pdf.jpg002632fa1cf2cae1eed324f0643b385aMD53open access1884/341562024-03-28 14:27:09.972open accessoai:acervodigital.ufpr.br:1884/34156Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-03-28T17:27:09Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
title Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
spellingShingle Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
Duarte, Denio
Banco de dados relacionais
Programação logica
Ciência da Computação
title_short Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
title_full Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
title_fullStr Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
title_full_unstemmed Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
title_sort Utilizando técnicas de programação lógica indutiva para mineração de banco de dados relacional
author Duarte, Denio
author_facet Duarte, Denio
author_role author
dc.contributor.other.pt_BR.fl_str_mv Ramirez Pozo, Aurora Trinidad, 1959-
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Vergilio, Silvia Regina, 1966-
dc.contributor.author.fl_str_mv Duarte, Denio
contributor_str_mv Vergilio, Silvia Regina, 1966-
dc.subject.por.fl_str_mv Banco de dados relacionais
Programação logica
Ciência da Computação
topic Banco de dados relacionais
Programação logica
Ciência da Computação
description Orientadora : Silvia Regina Vergilio
publishDate 2001
dc.date.issued.fl_str_mv 2001
dc.date.accessioned.fl_str_mv 2024-03-28T17:27:09Z
dc.date.available.fl_str_mv 2024-03-28T17:27:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/34156
url https://hdl.handle.net/1884/34156
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 78p. : il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/34156/1/R%20-%20D%20-%20DENIO%20DUARTE.pdf
https://acervodigital.ufpr.br/bitstream/1884/34156/2/R%20-%20D%20-%20DENIO%20DUARTE.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/34156/3/R%20-%20D%20-%20DENIO%20DUARTE.pdf.jpg
bitstream.checksum.fl_str_mv 39ebc218a6755f65d5c9841540ba2470
6e795b0337921a9a3bfc62fb296c0bd1
002632fa1cf2cae1eed324f0643b385a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1813898732257673216