Mineração de dados distribuída e escalável usando Apache Mahout

Detalhes bibliográficos
Autor(a) principal: Pereira, Adriano
Data de Publicação: 2010
Idioma: por
Título da fonte: Manancial - Repositório Digital da UFSM
dARK ID: ark:/26339/001300000p72g
Texto Completo: http://repositorio.ufsm.br/handle/1/25391
Resumo: Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010.
id UFSM_8a09f179748e394f81c51ec20fa47ef2
oai_identifier_str oai:repositorio.ufsm.br:1/25391
network_acronym_str UFSM
network_name_str Manancial - Repositório Digital da UFSM
repository_id_str
spelling Mineração de dados distribuída e escalável usando Apache MahoutMineração de dadosMineração de dados distribuídaApache MahoutCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010.Huge data sets have been generated from computing tools. Implicit patterns could be present in this data. Data mining worries in look for relationship, specially, in large data sets, enabling the extration of useful new information. Distributed computing allows the data decentralization and speeds up the data mining process. Apache Mahout is a distributed data mining tool, which uses MapReduce program model, promising scalability by spliting the workload in independents tasks, among themselves. This work has as objective to verify Apache Mahout’s performance, through a implemented algoritms’ choice, data set preparation and mining of these data in differents distributed environments, analyzing the tool’s scalability, as the performance improvement due to nodes’ or cores’ addition to the processing.Grandes volumes de dados vêm sendo gerados por ferramentas computacionais. Nestes dados, podem haver padrões implícitos, a partir dos quais pode ser possível extrair novos conhecimentos. A mineração de dados preocupa-se com a busca de relações, especialmente, em grandes quantidades de dados, possibilitando a extração de novas informações úteis. O uso de computação distribuída permite a descentralização dos dados e a aceleração do processo de mineração. Apache Mahout é uma ferramenta para a mineração de dados distribuída, que faz uso do modelo de programação MapReduce, prometendo escalabilidade ao dividir a carga de trabalho em tarefas independentes entre si. Este trabalho tem como objetivo verificar o desempenho do Apache Mahout, através da seleção de algoritmos implementados pela ferramenta, preparação de um conjunto de dados, e execução destes algoritmos, neste conjunto de dados, em diferentes ambientes distribuídos, analisando a escalabilidade da ferramenta, quanto ao ganho de desempenho em relação ao acréscimo de nodos ou núcleos ao processamento.BrasilUFSMCentro de TecnologiaCharao, Andrea SchwertnerPereira, Adriano2022-07-18T14:15:36Z2022-07-18T14:15:36Z2010-12-062010Trabalho de Conclusão de Curso de Graduaçãoinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://repositorio.ufsm.br/handle/1/25391ark:/26339/001300000p72gporAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2022-08-18T18:07:22Zoai:repositorio.ufsm.br:1/25391Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/ONGhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.comopendoar:2022-08-18T18:07:22Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false
dc.title.none.fl_str_mv Mineração de dados distribuída e escalável usando Apache Mahout
title Mineração de dados distribuída e escalável usando Apache Mahout
spellingShingle Mineração de dados distribuída e escalável usando Apache Mahout
Pereira, Adriano
Mineração de dados
Mineração de dados distribuída
Apache Mahout
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Mineração de dados distribuída e escalável usando Apache Mahout
title_full Mineração de dados distribuída e escalável usando Apache Mahout
title_fullStr Mineração de dados distribuída e escalável usando Apache Mahout
title_full_unstemmed Mineração de dados distribuída e escalável usando Apache Mahout
title_sort Mineração de dados distribuída e escalável usando Apache Mahout
author Pereira, Adriano
author_facet Pereira, Adriano
author_role author
dc.contributor.none.fl_str_mv Charao, Andrea Schwertner
dc.contributor.author.fl_str_mv Pereira, Adriano
dc.subject.por.fl_str_mv Mineração de dados
Mineração de dados distribuída
Apache Mahout
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Mineração de dados
Mineração de dados distribuída
Apache Mahout
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010.
publishDate 2010
dc.date.none.fl_str_mv 2010-12-06
2010
2022-07-18T14:15:36Z
2022-07-18T14:15:36Z
dc.type.driver.fl_str_mv Trabalho de Conclusão de Curso de Graduação
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufsm.br/handle/1/25391
dc.identifier.dark.fl_str_mv ark:/26339/001300000p72g
url http://repositorio.ufsm.br/handle/1/25391
identifier_str_mv ark:/26339/001300000p72g
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Brasil
UFSM
Centro de Tecnologia
publisher.none.fl_str_mv Brasil
UFSM
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Manancial - Repositório Digital da UFSM
instname:Universidade Federal de Santa Maria (UFSM)
instacron:UFSM
instname_str Universidade Federal de Santa Maria (UFSM)
instacron_str UFSM
institution UFSM
reponame_str Manancial - Repositório Digital da UFSM
collection Manancial - Repositório Digital da UFSM
repository.name.fl_str_mv Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)
repository.mail.fl_str_mv atendimento.sib@ufsm.br||tedebc@gmail.com
_version_ 1815172371956367360