Abordagem paralela para mineração de regras de associação negativas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/204306 |
Resumo: | Mineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais. |
id |
UNSP_7abe7fce2280abbd81461eb35df95108 |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/204306 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Abordagem paralela para mineração de regras de associação negativasParallel approach to negative association rule miningCiência da computaçãoMineração de dados (Computação)Algorítmos paralelosData miningFrequent patternsNegative association rulesParallel algorithmMineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais.Frequent pattern mining and association rules are one of the main fields of research in Data Mining, which aims to identify consistent relationships among elements. Existing algorithms in this field of study are based mainly on the occurrence information of the elements. However, considering the absence of elements for rules generation may result in interesting associations for some applications, which may provide previously unknown knowledge to data scientists or analysts. This type of association is called negative association rule, and its main characteristic is the explosion of the number of generated rules which demands adequate computational capacity for its processing. In this work, several approaches were explored, and a method was proposed. Such method presents as main objectives to accelerate the rule generation process and to allow the mining of larger datasets. Considering the stage of identifying frequent sets, the proposed method implements four approaches that explore parallel computing platforms. Such approaches presents better performance in specific situations, so that depending on the datasets to be analyzed, the use of one of these will be recommended. The rule generation stage of the proposed method also explores parallel platforms. Through the obtained results it was possible to verify that the method reaches the proposed objectives. In addition, the developed method enables mining large datasets that are considered restrictive for existing implementations. Finally, the proposed method is scalable, which allows to improve its performance through increasing computational resources.Universidade Estadual Paulista (Unesp)Spolon, Roberta [UNESP]Universidade Estadual Paulista (Unesp)Colombo, Alexandre2021-04-08T12:58:21Z2021-04-08T12:58:21Z2021-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/20430633004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-04-23T14:48:47Zoai:repositorio.unesp.br:11449/204306Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T23:47:31.141880Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Abordagem paralela para mineração de regras de associação negativas Parallel approach to negative association rule mining |
title |
Abordagem paralela para mineração de regras de associação negativas |
spellingShingle |
Abordagem paralela para mineração de regras de associação negativas Colombo, Alexandre Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm |
title_short |
Abordagem paralela para mineração de regras de associação negativas |
title_full |
Abordagem paralela para mineração de regras de associação negativas |
title_fullStr |
Abordagem paralela para mineração de regras de associação negativas |
title_full_unstemmed |
Abordagem paralela para mineração de regras de associação negativas |
title_sort |
Abordagem paralela para mineração de regras de associação negativas |
author |
Colombo, Alexandre |
author_facet |
Colombo, Alexandre |
author_role |
author |
dc.contributor.none.fl_str_mv |
Spolon, Roberta [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Colombo, Alexandre |
dc.subject.por.fl_str_mv |
Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm |
topic |
Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm |
description |
Mineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-04-08T12:58:21Z 2021-04-08T12:58:21Z 2021-03-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/204306 33004153073P2 |
url |
http://hdl.handle.net/11449/204306 |
identifier_str_mv |
33004153073P2 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808129552615997440 |