Avaliação do framework mapreduce para paralelização do algoritmo apriori
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/5098 |
Resumo: | The frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threads |
id |
UFLA_94c0d6fdddc6297f5762be1ca1e377df |
---|---|
oai_identifier_str |
oai:localhost:1/5098 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Avaliação do framework mapreduce para paralelização do algoritmo aprioriProcessamento paralelo e distribuidoMineração de dadosAlgoritmo aprioriMapReduceThe frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threadsA mineração de padrões frequentes é uma área da computação de ampla utilização. Seu objetivo é encontrar padrões de informações relevantes em grandes quantidades de dados. Porém, os principais algoritmos para mineração de padrões frequentes possuem alto tempo de execução, visto o grande volume de dados com que trabalham. Sendo assim, a programação paralela e distribuída e os frameworks de paralelização de algoritmos são uma boa alternativa para reduzir o tempo de execução necessário para processar as aplicações. Este trabalho propõe a implementação paralela e distribuída do algoritmo Apriori, bastante conhecido na área da mineração de padrões frequentes, utilizando para isso o Framework MapReduce. Os resultados são comparados com o algoritmo DMTA (Distributed Multithread Apriori), que também executa o algoritmo Apriori de forma paralela e distribuída, mas utilizando as bibliotecas MPI e OpenMP para criar e gerenciar processos e threads.Esmin, Ahmed Ali AbdallaPereira, Marluce RodriguesPereira, Denilson AlvesCastro, Cristiano Leite deBolina, André Camilo2015-02-19T20:09:58Z2015-02-19T20:09:58Z20152013-04-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfBOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.http://repositorio.ufla.br/jspui/handle/1/5098info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2018-10-09T19:03:50Zoai:localhost:1/5098Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2018-10-09T19:03:50Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
title |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
spellingShingle |
Avaliação do framework mapreduce para paralelização do algoritmo apriori Bolina, André Camilo Processamento paralelo e distribuido Mineração de dados Algoritmo apriori MapReduce |
title_short |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
title_full |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
title_fullStr |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
title_full_unstemmed |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
title_sort |
Avaliação do framework mapreduce para paralelização do algoritmo apriori |
author |
Bolina, André Camilo |
author_facet |
Bolina, André Camilo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Esmin, Ahmed Ali Abdalla Pereira, Marluce Rodrigues Pereira, Denilson Alves Castro, Cristiano Leite de |
dc.contributor.author.fl_str_mv |
Bolina, André Camilo |
dc.subject.por.fl_str_mv |
Processamento paralelo e distribuido Mineração de dados Algoritmo apriori MapReduce |
topic |
Processamento paralelo e distribuido Mineração de dados Algoritmo apriori MapReduce |
description |
The frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threads |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-04-15 2015-02-19T20:09:58Z 2015-02-19T20:09:58Z 2015 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014. http://repositorio.ufla.br/jspui/handle/1/5098 |
identifier_str_mv |
BOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014. |
url |
http://repositorio.ufla.br/jspui/handle/1/5098 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1807835202408415232 |