Abordagem paralela para mineração de regras de associação negativas

Colombo, Alexandre

Abordagem paralela para mineração de regras de associação negativas

Detalhes bibliográficos
Autor(a) principal:	Colombo, Alexandre
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UNESP
Texto Completo:	http://hdl.handle.net/11449/204306
Resumo:	Mineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais.

Metadados do item

id	UNSP_7abe7fce2280abbd81461eb35df95108
oai_identifier_str	oai:repositorio.unesp.br:11449/204306
network_acronym_str	UNSP
network_name_str	Repositório Institucional da UNESP
repository_id_str	2946
spelling	Abordagem paralela para mineração de regras de associação negativasParallel approach to negative association rule miningCiência da computaçãoMineração de dados (Computação)Algorítmos paralelosData miningFrequent patternsNegative association rulesParallel algorithmMineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais.Frequent pattern mining and association rules are one of the main fields of research in Data Mining, which aims to identify consistent relationships among elements. Existing algorithms in this field of study are based mainly on the occurrence information of the elements. However, considering the absence of elements for rules generation may result in interesting associations for some applications, which may provide previously unknown knowledge to data scientists or analysts. This type of association is called negative association rule, and its main characteristic is the explosion of the number of generated rules which demands adequate computational capacity for its processing. In this work, several approaches were explored, and a method was proposed. Such method presents as main objectives to accelerate the rule generation process and to allow the mining of larger datasets. Considering the stage of identifying frequent sets, the proposed method implements four approaches that explore parallel computing platforms. Such approaches presents better performance in specific situations, so that depending on the datasets to be analyzed, the use of one of these will be recommended. The rule generation stage of the proposed method also explores parallel platforms. Through the obtained results it was possible to verify that the method reaches the proposed objectives. In addition, the developed method enables mining large datasets that are considered restrictive for existing implementations. Finally, the proposed method is scalable, which allows to improve its performance through increasing computational resources.Universidade Estadual Paulista (Unesp)Spolon, Roberta [UNESP]Universidade Estadual Paulista (Unesp)Colombo, Alexandre2021-04-08T12:58:21Z2021-04-08T12:58:21Z2021-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/20430633004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-04-23T14:48:47Zoai:repositorio.unesp.br:11449/204306Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T23:47:31.141880Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv	Abordagem paralela para mineração de regras de associação negativas Parallel approach to negative association rule mining
title	Abordagem paralela para mineração de regras de associação negativas
spellingShingle	Abordagem paralela para mineração de regras de associação negativas Colombo, Alexandre Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm
title_short	Abordagem paralela para mineração de regras de associação negativas
title_full	Abordagem paralela para mineração de regras de associação negativas
title_fullStr	Abordagem paralela para mineração de regras de associação negativas
title_full_unstemmed	Abordagem paralela para mineração de regras de associação negativas
title_sort	Abordagem paralela para mineração de regras de associação negativas
author	Colombo, Alexandre
author_facet	Colombo, Alexandre
author_role	author
dc.contributor.none.fl_str_mv	Spolon, Roberta [UNESP] Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv	Colombo, Alexandre
dc.subject.por.fl_str_mv	Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm
topic	Ciência da computação Mineração de dados (Computação) Algorítmos paralelos Data mining Frequent patterns Negative association rules Parallel algorithm
description	Mineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais.
publishDate	2021
dc.date.none.fl_str_mv	2021-04-08T12:58:21Z 2021-04-08T12:58:21Z 2021-03-15
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/11449/204306 33004153073P2
url	http://hdl.handle.net/11449/204306
identifier_str_mv	33004153073P2
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP
instname_str	Universidade Estadual Paulista (UNESP)
instacron_str	UNESP
institution	UNESP
reponame_str	Repositório Institucional da UNESP
collection	Repositório Institucional da UNESP
repository.name.fl_str_mv	Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_	1808129552615997440

Abordagem paralela para mineração de regras de associação negativas

Registros relacionados