Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento

Detalhes bibliográficos
Autor(a) principal: Cintra, Luiz Fernando da Cunha
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
dARK ID: ark:/38995/0013000002msz
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tede/13106
Resumo: Association rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis.
id UFG-2_e233da11fec3c6df810c7b305c29e8ae
oai_identifier_str oai:repositorio.bc.ufg.br:tede/13106
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Salvini, Rogerio Lopeshttp://lattes.cnpq.br/5009392667450875Salvini, Rogerio LopesRosa, Thierson CoutoAguilar Alonso, Eduardo Joséhttp://lattes.cnpq.br/6721658256890180Cintra, Luiz Fernando da Cunha2023-10-30T10:42:53Z2023-10-30T10:42:53Z2023-08-22CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023.http://repositorio.bc.ufg.br/tede/handle/tede/13106ark:/38995/0013000002mszAssociation rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis.Mineração de regras de associação (ARM, em inglês) é um método tradicional de mineração de dados que fornece informações sobre associações entre itens em bases de dados transacionais. Um problema conhecido da ARM é a grande quantidade de regras geradas, necessitando assim de abordagens para pós-processar essas regras para que um especialista humano seja capaz de analisar as associações encontradas. Além disso, em alguns contextos, o especialista do domínio está interessado em investigar como uma variável de interesse está relacionada às outras variáveis de uma base de dados. Em uma análise exploratória baseada em ARM, isso implica em buscar as associações em que um item de interesse aparece em qualquer parte da regra. Poucos métodos possuem o foco em pós-processar as regras geradas visando um item de interesse. O presente trabalho busca destacar as associações relevantes de um determinado item visando trazer conhecimento sobre o seu papel por meio das suas interações e relações em comum com os demais itens. Para isso, este trabalho propõe uma estratégia de pós-processamento de regras de associação, que seleciona e agrupa regras orientadas a um determinado item de interesse fornecido por um especialista de um domínio de conhecimento. Além do mais, é também apresentado uma forma gráfica para que as associações entre regras e agrupamentos de regras encontrados sejam mais facilmente visualizados e interpretados. Quatro estudos de casos mostram que o método proposto é admissível e consegue reduzir o número de regras relevantes para uma quantidade gerenciável, permitindo a análise do especialista do domínio. Grafos evidenciando as relações entre os agrupamentos foram gerados em todos os estudos de casos e facilitam a análise dos mesmos.Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2023-10-17T20:08:01Z workflow start=Step: editstep - action:claimaction No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Step: editstep - action:editaction Rejected by Luciana Ferreira(lucgeral@gmail.com), reason: O nome Eduardo José Aguilar Alonso é espanhol, logo a entrada deve ser: Aguilar Alonso, Eduardo José on 2023-10-25T11:57:58Z (GMT)Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2023-10-27T18:17:19Z workflow start=Step: editstep - action:claimaction No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Step: editstep - action:editaction Approved for entry into archive by Luciana Ferreira(lucgeral@gmail.com) on 2023-10-30T10:42:53Z (GMT)Made available in DSpace on 2023-10-30T10:42:53Z (GMT). No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2023-08-22porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessRegras de associaçãoPós-processamentoARMAgrupamentoAssociation rulesPost-processingGroupingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimentoA post-processing strategy for selecting association rules for knowledge discoveryinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/731fab4f-bb56-4c21-b231-e0df4925780e/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - Luiz Fernando da Cunha Cintra - 2023.pdfDissertação - Luiz Fernando da Cunha Cintra - 2023.pdfapplication/pdf5099370http://repositorio.bc.ufg.br/tede/bitstreams/bbbe8ed4-63af-4755-9113-8ba8e26c6bbf/download5e2a4dcdf1e08e3da7a77e1f599d30d8MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/53a08e66-cc16-42bb-8910-45176a7e25c3/download4460e5956bc1d1639be9ae6146a50347MD52tede/131062023-10-30 07:42:53.506http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/13106http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2023-10-30T10:42:53Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.none.fl_str_mv Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
dc.title.alternative.eng.fl_str_mv A post-processing strategy for selecting association rules for knowledge discovery
title Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
spellingShingle Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
Cintra, Luiz Fernando da Cunha
Regras de associação
Pós-processamento
ARM
Agrupamento
Association rules
Post-processing
Grouping
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
title_full Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
title_fullStr Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
title_full_unstemmed Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
title_sort Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
author Cintra, Luiz Fernando da Cunha
author_facet Cintra, Luiz Fernando da Cunha
author_role author
dc.contributor.advisor1.fl_str_mv Salvini, Rogerio Lopes
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5009392667450875
dc.contributor.referee1.fl_str_mv Salvini, Rogerio Lopes
dc.contributor.referee2.fl_str_mv Rosa, Thierson Couto
dc.contributor.referee3.fl_str_mv Aguilar Alonso, Eduardo José
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6721658256890180
dc.contributor.author.fl_str_mv Cintra, Luiz Fernando da Cunha
contributor_str_mv Salvini, Rogerio Lopes
Salvini, Rogerio Lopes
Rosa, Thierson Couto
Aguilar Alonso, Eduardo José
dc.subject.por.fl_str_mv Regras de associação
Pós-processamento
ARM
Agrupamento
topic Regras de associação
Pós-processamento
ARM
Agrupamento
Association rules
Post-processing
Grouping
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Association rules
Post-processing
Grouping
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Association rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-10-30T10:42:53Z
dc.date.available.fl_str_mv 2023-10-30T10:42:53Z
dc.date.issued.fl_str_mv 2023-08-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/13106
dc.identifier.dark.fl_str_mv ark:/38995/0013000002msz
identifier_str_mv CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023.
ark:/38995/0013000002msz
url http://repositorio.bc.ufg.br/tede/handle/tede/13106
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/731fab4f-bb56-4c21-b231-e0df4925780e/download
http://repositorio.bc.ufg.br/tede/bitstreams/bbbe8ed4-63af-4755-9113-8ba8e26c6bbf/download
http://repositorio.bc.ufg.br/tede/bitstreams/53a08e66-cc16-42bb-8910-45176a7e25c3/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
5e2a4dcdf1e08e3da7a77e1f599d30d8
4460e5956bc1d1639be9ae6146a50347
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1815172537247596544