Junções por similaridade em múltiplos conjuntos utilizando MapReduce
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/31284 |
Resumo: | Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável. |
id |
UFLA_1264979998a35636569604d5da259a82 |
---|---|
oai_identifier_str |
oai:localhost:1/31284 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Junções por similaridade em múltiplos conjuntos utilizando MapReduceBanco de dadosJunções de similaridadeMapReduceComputação paralelaComputação DistribuídaOperações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.Ribeiro, Leonardo AndradePereira, Marluce RodriguesPereira, Denilson AlvesSousa, Luís Henrique Borges2018-10-10T13:53:48Z2018-10-10T13:53:48Z2015-01-262013-08-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.http://repositorio.ufla.br/jspui/handle/1/31284info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2018-10-10T13:53:48Zoai:localhost:1/31284Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2018-10-10T13:53:48Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
title |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
spellingShingle |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce Sousa, Luís Henrique Borges Banco de dados Junções de similaridade MapReduce Computação paralela Computação Distribuída |
title_short |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
title_full |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
title_fullStr |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
title_full_unstemmed |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
title_sort |
Junções por similaridade em múltiplos conjuntos utilizando MapReduce |
author |
Sousa, Luís Henrique Borges |
author_facet |
Sousa, Luís Henrique Borges |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ribeiro, Leonardo Andrade Pereira, Marluce Rodrigues Pereira, Denilson Alves |
dc.contributor.author.fl_str_mv |
Sousa, Luís Henrique Borges |
dc.subject.por.fl_str_mv |
Banco de dados Junções de similaridade MapReduce Computação paralela Computação Distribuída |
topic |
Banco de dados Junções de similaridade MapReduce Computação paralela Computação Distribuída |
description |
Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-08-29 2015-01-26 2018-10-10T13:53:48Z 2018-10-10T13:53:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013. http://repositorio.ufla.br/jspui/handle/1/31284 |
identifier_str_mv |
SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013. |
url |
http://repositorio.ufla.br/jspui/handle/1/31284 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1784550017148649472 |