Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados

Detalhes bibliográficos
Autor(a) principal: Ferraz, Inhaúma Neves
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/26091
Resumo: As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios.
id UFF-2_0cd9085dd79642ec0dda0cb3fb167c11
oai_identifier_str oai:app.uff.br:1/26091
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dadosMineração de dadosRegras de associaçãoModelo SemPruneMineração de dados (Computação)Regras de associaçãoModelo SemPruneData MiningAssociation RulesSemPrune ModelAs regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios.157 p.Garcia, Ana Cristina BicharraConci, AuraCarvalho, Alexandre Plastino deCorreia, Luis Miguel Parreira eGarza, Jesus M. de laFerraz, Inhaúma Neves2022-08-11T12:35:54Z2022-08-11T12:35:54Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfFERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008.http://app.uff.br/riuff/handle/1/26091CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-06-07T18:32:37Zoai:app.uff.br:1/26091Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-06-07T18:32:37Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
title Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
spellingShingle Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
Ferraz, Inhaúma Neves
Mineração de dados
Regras de associação
Modelo SemPrune
Mineração de dados (Computação)
Regras de associação
Modelo SemPrune
Data Mining
Association Rules
SemPrune Model
title_short Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
title_full Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
title_fullStr Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
title_full_unstemmed Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
title_sort Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
author Ferraz, Inhaúma Neves
author_facet Ferraz, Inhaúma Neves
author_role author
dc.contributor.none.fl_str_mv Garcia, Ana Cristina Bicharra
Conci, Aura
Carvalho, Alexandre Plastino de
Correia, Luis Miguel Parreira e
Garza, Jesus M. de la
dc.contributor.author.fl_str_mv Ferraz, Inhaúma Neves
dc.subject.por.fl_str_mv Mineração de dados
Regras de associação
Modelo SemPrune
Mineração de dados (Computação)
Regras de associação
Modelo SemPrune
Data Mining
Association Rules
SemPrune Model
topic Mineração de dados
Regras de associação
Modelo SemPrune
Mineração de dados (Computação)
Regras de associação
Modelo SemPrune
Data Mining
Association Rules
SemPrune Model
description As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios.
publishDate 2022
dc.date.none.fl_str_mv 2022-08-11T12:35:54Z
2022-08-11T12:35:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008.
http://app.uff.br/riuff/handle/1/26091
identifier_str_mv FERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008.
url http://app.uff.br/riuff/handle/1/26091
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1807838904604164096