Avaliação do framework mapreduce para paralelização do algoritmo apriori

Detalhes bibliográficos
Autor(a) principal: Bolina, André Camilo
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/5098
Resumo: The frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threads
id UFLA_94c0d6fdddc6297f5762be1ca1e377df
oai_identifier_str oai:localhost:1/5098
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Avaliação do framework mapreduce para paralelização do algoritmo aprioriProcessamento paralelo e distribuidoMineração de dadosAlgoritmo aprioriMapReduceThe frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threadsA mineração de padrões frequentes é uma área da computação de ampla utilização. Seu objetivo é encontrar padrões de informações relevantes em grandes quantidades de dados. Porém, os principais algoritmos para mineração de padrões frequentes possuem alto tempo de execução, visto o grande volume de dados com que trabalham. Sendo assim, a programação paralela e distribuída e os frameworks de paralelização de algoritmos são uma boa alternativa para reduzir o tempo de execução necessário para processar as aplicações. Este trabalho propõe a implementação paralela e distribuída do algoritmo Apriori, bastante conhecido na área da mineração de padrões frequentes, utilizando para isso o Framework MapReduce. Os resultados são comparados com o algoritmo DMTA (Distributed Multithread Apriori), que também executa o algoritmo Apriori de forma paralela e distribuída, mas utilizando as bibliotecas MPI e OpenMP para criar e gerenciar processos e threads.Esmin, Ahmed Ali AbdallaPereira, Marluce RodriguesPereira, Denilson AlvesCastro, Cristiano Leite deBolina, André Camilo2015-02-19T20:09:58Z2015-02-19T20:09:58Z20152013-04-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfBOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.http://repositorio.ufla.br/jspui/handle/1/5098info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2018-10-09T19:03:50Zoai:localhost:1/5098Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2018-10-09T19:03:50Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Avaliação do framework mapreduce para paralelização do algoritmo apriori
title Avaliação do framework mapreduce para paralelização do algoritmo apriori
spellingShingle Avaliação do framework mapreduce para paralelização do algoritmo apriori
Bolina, André Camilo
Processamento paralelo e distribuido
Mineração de dados
Algoritmo apriori
MapReduce
title_short Avaliação do framework mapreduce para paralelização do algoritmo apriori
title_full Avaliação do framework mapreduce para paralelização do algoritmo apriori
title_fullStr Avaliação do framework mapreduce para paralelização do algoritmo apriori
title_full_unstemmed Avaliação do framework mapreduce para paralelização do algoritmo apriori
title_sort Avaliação do framework mapreduce para paralelização do algoritmo apriori
author Bolina, André Camilo
author_facet Bolina, André Camilo
author_role author
dc.contributor.none.fl_str_mv Esmin, Ahmed Ali Abdalla
Pereira, Marluce Rodrigues
Pereira, Denilson Alves
Castro, Cristiano Leite de
dc.contributor.author.fl_str_mv Bolina, André Camilo
dc.subject.por.fl_str_mv Processamento paralelo e distribuido
Mineração de dados
Algoritmo apriori
MapReduce
topic Processamento paralelo e distribuido
Mineração de dados
Algoritmo apriori
MapReduce
description The frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threads
publishDate 2013
dc.date.none.fl_str_mv 2013-04-15
2015-02-19T20:09:58Z
2015-02-19T20:09:58Z
2015
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.
http://repositorio.ufla.br/jspui/handle/1/5098
identifier_str_mv BOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.
url http://repositorio.ufla.br/jspui/handle/1/5098
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1807835202408415232