Um estudo sobre a performance de aplicações Big Data com Deep Learning

Detalhes bibliográficos
Autor(a) principal: Bertoncello, Germano
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/190195
Resumo: Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%.
id UFRGS-2_5d5e629612f5c0380db80094c204c929
oai_identifier_str oai:www.lume.ufrgs.br:10183/190195
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Bertoncello, GermanoGeyer, Claudio Fernando ResinZanchetta, Breno Fanchiotti2019-04-09T02:35:00Z2018http://hdl.handle.net/10183/190195001088717Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%.Deep Learning (DL) and Big Data (BD) have converged to a hybrid computing paradigm that merges the dynamic processing provided by DL models compled with the power of parallel and distributed processing of Big Data frameworks. This paper presents the performance evaluation of Big Data Deep Learning applications. Our experimental environment setup was controlled and represents a real test scenario. It is composed of a virtual cluster created in Microsoft Azure and configured to support the Apache Spark framework into the YARN system with the Hadoop Distributed File System (HDFS). In addition, to support the development of TensorFlow applications under Apache Spark, the framework BigDL was used. The obtained results indicate the effectiveness of the Big Data processing model with Deep Learning. It was attested that performance with distributed environment was improved up to 87.4%; cost reduces until 41.3%, and loss in accuracy was less than 5% for the testbed.application/pdfporProcessamento distribuídoAprendizado : máquinaBig DataDeep LearningDistributed ProcessingTensorFlowApache SparkUm estudo sobre a performance de aplicações Big Data com Deep LearningA Performance Study of Big Data Deep Learning Applications info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2018Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001088717.pdf.txt001088717.pdf.txtExtracted Texttext/plain123328http://www.lume.ufrgs.br/bitstream/10183/190195/2/001088717.pdf.txt04c37c8ff58a4a710ce6ad50c5acab22MD52ORIGINAL001088717.pdfTexto completoapplication/pdf632960http://www.lume.ufrgs.br/bitstream/10183/190195/1/001088717.pdf5c6f78ffd7c0d945f5f2305d2ceb2e26MD5110183/1901952022-02-22 05:08:39.619383oai:www.lume.ufrgs.br:10183/190195Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-02-22T08:08:39Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Um estudo sobre a performance de aplicações Big Data com Deep Learning
dc.title.alternative.en.fl_str_mv A Performance Study of Big Data Deep Learning Applications
title Um estudo sobre a performance de aplicações Big Data com Deep Learning
spellingShingle Um estudo sobre a performance de aplicações Big Data com Deep Learning
Bertoncello, Germano
Processamento distribuído
Aprendizado : máquina
Big Data
Deep Learning
Distributed Processing
TensorFlow
Apache Spark
title_short Um estudo sobre a performance de aplicações Big Data com Deep Learning
title_full Um estudo sobre a performance de aplicações Big Data com Deep Learning
title_fullStr Um estudo sobre a performance de aplicações Big Data com Deep Learning
title_full_unstemmed Um estudo sobre a performance de aplicações Big Data com Deep Learning
title_sort Um estudo sobre a performance de aplicações Big Data com Deep Learning
author Bertoncello, Germano
author_facet Bertoncello, Germano
author_role author
dc.contributor.author.fl_str_mv Bertoncello, Germano
dc.contributor.advisor1.fl_str_mv Geyer, Claudio Fernando Resin
dc.contributor.advisor-co1.fl_str_mv Zanchetta, Breno Fanchiotti
contributor_str_mv Geyer, Claudio Fernando Resin
Zanchetta, Breno Fanchiotti
dc.subject.por.fl_str_mv Processamento distribuído
Aprendizado : máquina
topic Processamento distribuído
Aprendizado : máquina
Big Data
Deep Learning
Distributed Processing
TensorFlow
Apache Spark
dc.subject.eng.fl_str_mv Big Data
Deep Learning
Distributed Processing
TensorFlow
Apache Spark
description Deep Learning (DL) e Big Data (BD) convergiram para um paradigma de computação híbrido capaz de unir o processamento dinâmico fornecido pelos modelos DL aliado ao poder do processamento paralelo e distribuído de frameworks BD. Este trabalho avalia o impacto causado na performance das aplicações Deep Learning junto ao modelo de programação paralelo e distribuído proveniente de frameworks de processamento Big Data. O ambiente de experimentação é controlado e representa um cenário de testes real e é composto por um cluster virtual criado na Microsoft Azure e configurado para suportar o framework Apache Spark sob o sistema YARN junto ao sistema de arquivos distribuídos do Hadoop (HDFS). Além disso, para suportar o desenvolvimento das aplicações TensorFlow sob o Apache Spark, foi utilizado o framework BigDL. Os resultados obtidos indicam a eficácia do modelo de processamento Big Data com Deep Learning, constata-se um ganho de desempenho de até 87,4% no ambiente distribuído de ; redução de custodo treinamento de até 41,3%, e perda de precisão dos modelos menor que 5%.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-04-09T02:35:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/190195
dc.identifier.nrb.pt_BR.fl_str_mv 001088717
url http://hdl.handle.net/10183/190195
identifier_str_mv 001088717
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/190195/2/001088717.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/190195/1/001088717.pdf
bitstream.checksum.fl_str_mv 04c37c8ff58a4a710ce6ad50c5acab22
5c6f78ffd7c0d945f5f2305d2ceb2e26
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224571628552192