Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFG |
dARK ID: | ark:/38995/0013000002msz |
Texto Completo: | http://repositorio.bc.ufg.br/tede/handle/tede/13106 |
Resumo: | Association rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis. |
id |
UFG-2_e233da11fec3c6df810c7b305c29e8ae |
---|---|
oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/13106 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
|
spelling |
Salvini, Rogerio Lopeshttp://lattes.cnpq.br/5009392667450875Salvini, Rogerio LopesRosa, Thierson CoutoAguilar Alonso, Eduardo Joséhttp://lattes.cnpq.br/6721658256890180Cintra, Luiz Fernando da Cunha2023-10-30T10:42:53Z2023-10-30T10:42:53Z2023-08-22CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023.http://repositorio.bc.ufg.br/tede/handle/tede/13106ark:/38995/0013000002mszAssociation rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis.Mineração de regras de associação (ARM, em inglês) é um método tradicional de mineração de dados que fornece informações sobre associações entre itens em bases de dados transacionais. Um problema conhecido da ARM é a grande quantidade de regras geradas, necessitando assim de abordagens para pós-processar essas regras para que um especialista humano seja capaz de analisar as associações encontradas. Além disso, em alguns contextos, o especialista do domínio está interessado em investigar como uma variável de interesse está relacionada às outras variáveis de uma base de dados. Em uma análise exploratória baseada em ARM, isso implica em buscar as associações em que um item de interesse aparece em qualquer parte da regra. Poucos métodos possuem o foco em pós-processar as regras geradas visando um item de interesse. O presente trabalho busca destacar as associações relevantes de um determinado item visando trazer conhecimento sobre o seu papel por meio das suas interações e relações em comum com os demais itens. Para isso, este trabalho propõe uma estratégia de pós-processamento de regras de associação, que seleciona e agrupa regras orientadas a um determinado item de interesse fornecido por um especialista de um domínio de conhecimento. Além do mais, é também apresentado uma forma gráfica para que as associações entre regras e agrupamentos de regras encontrados sejam mais facilmente visualizados e interpretados. Quatro estudos de casos mostram que o método proposto é admissível e consegue reduzir o número de regras relevantes para uma quantidade gerenciável, permitindo a análise do especialista do domínio. Grafos evidenciando as relações entre os agrupamentos foram gerados em todos os estudos de casos e facilitam a análise dos mesmos.Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2023-10-17T20:08:01Z workflow start=Step: editstep - action:claimaction No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Step: editstep - action:editaction Rejected by Luciana Ferreira(lucgeral@gmail.com), reason: O nome Eduardo José Aguilar Alonso é espanhol, logo a entrada deve ser: Aguilar Alonso, Eduardo José on 2023-10-25T11:57:58Z (GMT)Submitted by Marlene Santos (marlene.bc.ufg@gmail.com) on 2023-10-27T18:17:19Z workflow start=Step: editstep - action:claimaction No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Step: editstep - action:editaction Approved for entry into archive by Luciana Ferreira(lucgeral@gmail.com) on 2023-10-30T10:42:53Z (GMT)Made available in DSpace on 2023-10-30T10:42:53Z (GMT). No. of bitstreams: 2 Dissertação - Luiz Fernando da Cunha Cintra - 2023.pdf: 5099370 bytes, checksum: 5e2a4dcdf1e08e3da7a77e1f599d30d8 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2023-08-22porUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessRegras de associaçãoPós-processamentoARMAgrupamentoAssociation rulesPost-processingGroupingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimentoA post-processing strategy for selecting association rules for knowledge discoveryinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/731fab4f-bb56-4c21-b231-e0df4925780e/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - Luiz Fernando da Cunha Cintra - 2023.pdfDissertação - Luiz Fernando da Cunha Cintra - 2023.pdfapplication/pdf5099370http://repositorio.bc.ufg.br/tede/bitstreams/bbbe8ed4-63af-4755-9113-8ba8e26c6bbf/download5e2a4dcdf1e08e3da7a77e1f599d30d8MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/53a08e66-cc16-42bb-8910-45176a7e25c3/download4460e5956bc1d1639be9ae6146a50347MD52tede/131062023-10-30 07:42:53.506http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/13106http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2023-10-30T10:42:53Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
dc.title.none.fl_str_mv |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
dc.title.alternative.eng.fl_str_mv |
A post-processing strategy for selecting association rules for knowledge discovery |
title |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
spellingShingle |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento Cintra, Luiz Fernando da Cunha Regras de associação Pós-processamento ARM Agrupamento Association rules Post-processing Grouping CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
title_full |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
title_fullStr |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
title_full_unstemmed |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
title_sort |
Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento |
author |
Cintra, Luiz Fernando da Cunha |
author_facet |
Cintra, Luiz Fernando da Cunha |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Salvini, Rogerio Lopes |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5009392667450875 |
dc.contributor.referee1.fl_str_mv |
Salvini, Rogerio Lopes |
dc.contributor.referee2.fl_str_mv |
Rosa, Thierson Couto |
dc.contributor.referee3.fl_str_mv |
Aguilar Alonso, Eduardo José |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6721658256890180 |
dc.contributor.author.fl_str_mv |
Cintra, Luiz Fernando da Cunha |
contributor_str_mv |
Salvini, Rogerio Lopes Salvini, Rogerio Lopes Rosa, Thierson Couto Aguilar Alonso, Eduardo José |
dc.subject.por.fl_str_mv |
Regras de associação Pós-processamento ARM Agrupamento |
topic |
Regras de associação Pós-processamento ARM Agrupamento Association rules Post-processing Grouping CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Association rules Post-processing Grouping |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Association rule mining (ARM) is a traditional data mining method that provides information about associations between items in transactional databases. A known problem of ARM is the large amount of rules generated, thus requiring approaches to post-process these rules so that a human expert is able to analyze the associations found. In some contexts the domain expert is interested in investigating only one item of interest, in these cases a search guided by the item of interest can help to mitigate the problem. For an exploratory analysis, this implies looking for associations in which the item of interest appears in any part of the rule. Few methods focus on post-processing the generated rules targeting an item of interest. The present work seeks to highlight the relevant associations of a given item in order to bring knowledge about its role through its interactions and relationships in common with the other items. For this, this work proposes a post-processing strategy of association rules, which selects and groups rules oriented to a certain item of interest provided by an expert of a domain of knowledge. In addition, a graphical form is also presented so that the associations between rules and groupings of rules found are more easily visualized and interpreted. Four case studies show that the proposed method is admissible and manages to reduce the number of relevant rules to a manageable amount, allowing analysis by domain experts. Graphs showing the relationships between the groups were generated in all case studies and facilitate their analysis. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-10-30T10:42:53Z |
dc.date.available.fl_str_mv |
2023-10-30T10:42:53Z |
dc.date.issued.fl_str_mv |
2023-08-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023. |
dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/13106 |
dc.identifier.dark.fl_str_mv |
ark:/38995/0013000002msz |
identifier_str_mv |
CINTRA, L. F. C. Uma estratégia de pós-processamento para seleção de regras de associação para descoberta de conhecimento. 2023. 108 f. Dissertação (Mestrado em Ciência Computação) - Instituto de Informática, Universidade Federal de Goiás, Goiânia, 2023. ark:/38995/0013000002msz |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/13106 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
dc.publisher.initials.fl_str_mv |
UFG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RG) |
publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/731fab4f-bb56-4c21-b231-e0df4925780e/download http://repositorio.bc.ufg.br/tede/bitstreams/bbbe8ed4-63af-4755-9113-8ba8e26c6bbf/download http://repositorio.bc.ufg.br/tede/bitstreams/53a08e66-cc16-42bb-8910-45176a7e25c3/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 5e2a4dcdf1e08e3da7a77e1f599d30d8 4460e5956bc1d1639be9ae6146a50347 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
tasesdissertacoes.bc@ufg.br |
_version_ |
1815172537247596544 |