Mineração de dados distribuída e escalável usando Apache Mahout
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Idioma: | por |
Título da fonte: | Manancial - Repositório Digital da UFSM |
dARK ID: | ark:/26339/001300000p72g |
Texto Completo: | http://repositorio.ufsm.br/handle/1/25391 |
Resumo: | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010. |
id |
UFSM_8a09f179748e394f81c51ec20fa47ef2 |
---|---|
oai_identifier_str |
oai:repositorio.ufsm.br:1/25391 |
network_acronym_str |
UFSM |
network_name_str |
Manancial - Repositório Digital da UFSM |
repository_id_str |
|
spelling |
Mineração de dados distribuída e escalável usando Apache MahoutMineração de dadosMineração de dados distribuídaApache MahoutCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010.Huge data sets have been generated from computing tools. Implicit patterns could be present in this data. Data mining worries in look for relationship, specially, in large data sets, enabling the extration of useful new information. Distributed computing allows the data decentralization and speeds up the data mining process. Apache Mahout is a distributed data mining tool, which uses MapReduce program model, promising scalability by spliting the workload in independents tasks, among themselves. This work has as objective to verify Apache Mahout’s performance, through a implemented algoritms’ choice, data set preparation and mining of these data in differents distributed environments, analyzing the tool’s scalability, as the performance improvement due to nodes’ or cores’ addition to the processing.Grandes volumes de dados vêm sendo gerados por ferramentas computacionais. Nestes dados, podem haver padrões implícitos, a partir dos quais pode ser possível extrair novos conhecimentos. A mineração de dados preocupa-se com a busca de relações, especialmente, em grandes quantidades de dados, possibilitando a extração de novas informações úteis. O uso de computação distribuída permite a descentralização dos dados e a aceleração do processo de mineração. Apache Mahout é uma ferramenta para a mineração de dados distribuída, que faz uso do modelo de programação MapReduce, prometendo escalabilidade ao dividir a carga de trabalho em tarefas independentes entre si. Este trabalho tem como objetivo verificar o desempenho do Apache Mahout, através da seleção de algoritmos implementados pela ferramenta, preparação de um conjunto de dados, e execução destes algoritmos, neste conjunto de dados, em diferentes ambientes distribuídos, analisando a escalabilidade da ferramenta, quanto ao ganho de desempenho em relação ao acréscimo de nodos ou núcleos ao processamento.BrasilUFSMCentro de TecnologiaCharao, Andrea SchwertnerPereira, Adriano2022-07-18T14:15:36Z2022-07-18T14:15:36Z2010-12-062010Trabalho de Conclusão de Curso de Graduaçãoinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://repositorio.ufsm.br/handle/1/25391ark:/26339/001300000p72gporAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2022-08-18T18:07:22Zoai:repositorio.ufsm.br:1/25391Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/ONGhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.comopendoar:2022-08-18T18:07:22Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false |
dc.title.none.fl_str_mv |
Mineração de dados distribuída e escalável usando Apache Mahout |
title |
Mineração de dados distribuída e escalável usando Apache Mahout |
spellingShingle |
Mineração de dados distribuída e escalável usando Apache Mahout Pereira, Adriano Mineração de dados Mineração de dados distribuída Apache Mahout CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Mineração de dados distribuída e escalável usando Apache Mahout |
title_full |
Mineração de dados distribuída e escalável usando Apache Mahout |
title_fullStr |
Mineração de dados distribuída e escalável usando Apache Mahout |
title_full_unstemmed |
Mineração de dados distribuída e escalável usando Apache Mahout |
title_sort |
Mineração de dados distribuída e escalável usando Apache Mahout |
author |
Pereira, Adriano |
author_facet |
Pereira, Adriano |
author_role |
author |
dc.contributor.none.fl_str_mv |
Charao, Andrea Schwertner |
dc.contributor.author.fl_str_mv |
Pereira, Adriano |
dc.subject.por.fl_str_mv |
Mineração de dados Mineração de dados distribuída Apache Mahout CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Mineração de dados Mineração de dados distribuída Apache Mahout CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Ciência da Computação, RS, 2010. |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010-12-06 2010 2022-07-18T14:15:36Z 2022-07-18T14:15:36Z |
dc.type.driver.fl_str_mv |
Trabalho de Conclusão de Curso de Graduação |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufsm.br/handle/1/25391 |
dc.identifier.dark.fl_str_mv |
ark:/26339/001300000p72g |
url |
http://repositorio.ufsm.br/handle/1/25391 |
identifier_str_mv |
ark:/26339/001300000p72g |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Brasil UFSM Centro de Tecnologia |
publisher.none.fl_str_mv |
Brasil UFSM Centro de Tecnologia |
dc.source.none.fl_str_mv |
reponame:Manancial - Repositório Digital da UFSM instname:Universidade Federal de Santa Maria (UFSM) instacron:UFSM |
instname_str |
Universidade Federal de Santa Maria (UFSM) |
instacron_str |
UFSM |
institution |
UFSM |
reponame_str |
Manancial - Repositório Digital da UFSM |
collection |
Manancial - Repositório Digital da UFSM |
repository.name.fl_str_mv |
Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM) |
repository.mail.fl_str_mv |
atendimento.sib@ufsm.br||tedebc@gmail.com |
_version_ |
1815172371956367360 |