Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/26091 |
Resumo: | As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios. |
id |
UFF-2_0cd9085dd79642ec0dda0cb3fb167c11 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/26091 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dadosMineração de dadosRegras de associaçãoModelo SemPruneMineração de dados (Computação)Regras de associaçãoModelo SemPruneData MiningAssociation RulesSemPrune ModelAs regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios.157 p.Garcia, Ana Cristina BicharraConci, AuraCarvalho, Alexandre Plastino deCorreia, Luis Miguel Parreira eGarza, Jesus M. de laFerraz, Inhaúma Neves2022-08-11T12:35:54Z2022-08-11T12:35:54Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfFERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008.http://app.uff.br/riuff/handle/1/26091CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-06-07T18:32:37Zoai:app.uff.br:1/26091Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202023-06-07T18:32:37Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
title |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
spellingShingle |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados Ferraz, Inhaúma Neves Mineração de dados Regras de associação Modelo SemPrune Mineração de dados (Computação) Regras de associação Modelo SemPrune Data Mining Association Rules SemPrune Model |
title_short |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
title_full |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
title_fullStr |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
title_full_unstemmed |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
title_sort |
Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados |
author |
Ferraz, Inhaúma Neves |
author_facet |
Ferraz, Inhaúma Neves |
author_role |
author |
dc.contributor.none.fl_str_mv |
Garcia, Ana Cristina Bicharra Conci, Aura Carvalho, Alexandre Plastino de Correia, Luis Miguel Parreira e Garza, Jesus M. de la |
dc.contributor.author.fl_str_mv |
Ferraz, Inhaúma Neves |
dc.subject.por.fl_str_mv |
Mineração de dados Regras de associação Modelo SemPrune Mineração de dados (Computação) Regras de associação Modelo SemPrune Data Mining Association Rules SemPrune Model |
topic |
Mineração de dados Regras de associação Modelo SemPrune Mineração de dados (Computação) Regras de associação Modelo SemPrune Data Mining Association Rules SemPrune Model |
description |
As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-08-11T12:35:54Z 2022-08-11T12:35:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
FERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008. http://app.uff.br/riuff/handle/1/26091 |
identifier_str_mv |
FERRAZ, Inhaúma Neves. Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados. 2022. 157 f. Tese (Doutorado em Ciência da Computação) – Universidade Federal Fluminense, Instituto de Computação, 2008. |
url |
http://app.uff.br/riuff/handle/1/26091 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1807838904604164096 |