Um estudo sobre a performance de aplicações Big Data com Deep Learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/190195 |
Resumo: | Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%. |
id |
UFRGS-2_5d5e629612f5c0380db80094c204c929 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/190195 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Bertoncello, GermanoGeyer, Claudio Fernando ResinZanchetta, Breno Fanchiotti2019-04-09T02:35:00Z2018http://hdl.handle.net/10183/190195001088717Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%.Deep Learning (DL) and Big Data (BD) have converged to a hybrid computing paradigm that merges the dynamic processing provided by DL models compled with the power of parallel and distributed processing of Big Data frameworks. This paper presents the performance evaluation of Big Data Deep Learning applications. Our experimental environment setup was controlled and represents a real test scenario. It is composed of a virtual cluster created in Microsoft Azure and configured to support the Apache Spark framework into the YARN system with the Hadoop Distributed File System (HDFS). In addition, to support the development of TensorFlow applications under Apache Spark, the framework BigDL was used. The obtained results indicate the effectiveness of the Big Data processing model with Deep Learning. It was attested that performance with distributed environment was improved up to 87.4%; cost reduces until 41.3%, and loss in accuracy was less than 5% for the testbed.application/pdfporProcessamento distribuídoAprendizado : máquinaBig DataDeep LearningDistributed ProcessingTensorFlowApache SparkUm estudo sobre a performance de aplicações Big Data com Deep LearningA Performance Study of Big Data Deep Learning Applications info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2018Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001088717.pdf.txt001088717.pdf.txtExtracted Texttext/plain123328http://www.lume.ufrgs.br/bitstream/10183/190195/2/001088717.pdf.txt04c37c8ff58a4a710ce6ad50c5acab22MD52ORIGINAL001088717.pdfTexto completoapplication/pdf632960http://www.lume.ufrgs.br/bitstream/10183/190195/1/001088717.pdf5c6f78ffd7c0d945f5f2305d2ceb2e26MD5110183/1901952022-02-22 05:08:39.619383oai:www.lume.ufrgs.br:10183/190195Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-02-22T08:08:39Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
dc.title.alternative.en.fl_str_mv |
A Performance Study of Big Data Deep Learning Applications |
title |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
spellingShingle |
Um estudo sobre a performance de aplicações Big Data com Deep Learning Bertoncello, Germano Processamento distribuído Aprendizado : máquina Big Data Deep Learning Distributed Processing TensorFlow Apache Spark |
title_short |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
title_full |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
title_fullStr |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
title_full_unstemmed |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
title_sort |
Um estudo sobre a performance de aplicações Big Data com Deep Learning |
author |
Bertoncello, Germano |
author_facet |
Bertoncello, Germano |
author_role |
author |
dc.contributor.author.fl_str_mv |
Bertoncello, Germano |
dc.contributor.advisor1.fl_str_mv |
Geyer, Claudio Fernando Resin |
dc.contributor.advisor-co1.fl_str_mv |
Zanchetta, Breno Fanchiotti |
contributor_str_mv |
Geyer, Claudio Fernando Resin Zanchetta, Breno Fanchiotti |
dc.subject.por.fl_str_mv |
Processamento distribuído Aprendizado : máquina |
topic |
Processamento distribuído Aprendizado : máquina Big Data Deep Learning Distributed Processing TensorFlow Apache Spark |
dc.subject.eng.fl_str_mv |
Big Data Deep Learning Distributed Processing TensorFlow Apache Spark |
description |
Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2019-04-09T02:35:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/190195 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001088717 |
url |
http://hdl.handle.net/10183/190195 |
identifier_str_mv |
001088717 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/190195/2/001088717.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/190195/1/001088717.pdf |
bitstream.checksum.fl_str_mv |
04c37c8ff58a4a710ce6ad50c5acab22 5c6f78ffd7c0d945f5f2305d2ceb2e26 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224571628552192 |