Junções por similaridade em múltiplos conjuntos utilizando MapReduce

Detalhes bibliográficos
Autor(a) principal: Sousa, Luís Henrique Borges
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/31284
Resumo: Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.
id UFLA_1264979998a35636569604d5da259a82
oai_identifier_str oai:localhost:1/31284
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Junções por similaridade em múltiplos conjuntos utilizando MapReduceBanco de dadosJunções de similaridadeMapReduceComputação paralelaComputação DistribuídaOperações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.Ribeiro, Leonardo AndradePereira, Marluce RodriguesPereira, Denilson AlvesSousa, Luís Henrique Borges2018-10-10T13:53:48Z2018-10-10T13:53:48Z2015-01-262013-08-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.http://repositorio.ufla.br/jspui/handle/1/31284info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2018-10-10T13:53:48Zoai:localhost:1/31284Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2018-10-10T13:53:48Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Junções por similaridade em múltiplos conjuntos utilizando MapReduce
title Junções por similaridade em múltiplos conjuntos utilizando MapReduce
spellingShingle Junções por similaridade em múltiplos conjuntos utilizando MapReduce
Sousa, Luís Henrique Borges
Banco de dados
Junções de similaridade
MapReduce
Computação paralela
Computação Distribuída
title_short Junções por similaridade em múltiplos conjuntos utilizando MapReduce
title_full Junções por similaridade em múltiplos conjuntos utilizando MapReduce
title_fullStr Junções por similaridade em múltiplos conjuntos utilizando MapReduce
title_full_unstemmed Junções por similaridade em múltiplos conjuntos utilizando MapReduce
title_sort Junções por similaridade em múltiplos conjuntos utilizando MapReduce
author Sousa, Luís Henrique Borges
author_facet Sousa, Luís Henrique Borges
author_role author
dc.contributor.none.fl_str_mv Ribeiro, Leonardo Andrade
Pereira, Marluce Rodrigues
Pereira, Denilson Alves
dc.contributor.author.fl_str_mv Sousa, Luís Henrique Borges
dc.subject.por.fl_str_mv Banco de dados
Junções de similaridade
MapReduce
Computação paralela
Computação Distribuída
topic Banco de dados
Junções de similaridade
MapReduce
Computação paralela
Computação Distribuída
description Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.
publishDate 2013
dc.date.none.fl_str_mv 2013-08-29
2015-01-26
2018-10-10T13:53:48Z
2018-10-10T13:53:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.
http://repositorio.ufla.br/jspui/handle/1/31284
identifier_str_mv SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.
url http://repositorio.ufla.br/jspui/handle/1/31284
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1784550017148649472