Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais

Bonatto, Luana Vieira Martinez

Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais

Detalhes bibliográficos
Autor(a) principal:	Bonatto, Luana Vieira Martinez
Data de Publicação:	2018
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFSC
Texto Completo:	https://repositorio.ufsc.br/handle/123456789/206078
Resumo:	Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2018.

Metadados do item

id	UFSC_57c5348b880086b19ce728ab2717846e
oai_identifier_str	oai:repositorio.ufsc.br:123456789/206078
network_acronym_str	UFSC
network_name_str	Repositório Institucional da UFSC
repository_id_str	2373
spelling	Universidade Federal de Santa CatarinaBonatto, Luana Vieira MartinezRoldán, Héctor Pettenghi2020-03-31T14:43:38Z2020-03-31T14:43:38Z2018359996https://repositorio.ufsc.br/handle/123456789/206078Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2018.Abstract : The Multiply-Accumulate (MAC) unit are applied to a set of applications, such as deep learning, digital signal processing, multimedia, among others. The convolutional operations, present in the main layer of Convolutional Neural Networks, implies a significant portion of the computational cost inherent to the networks, reaching proportions above 90\%. The computational efficiency of the applications is directly related to the speed of the adders and multipliers in MAC. Some application scenarios make use of this type of technology, such as objects detection and classification, present strict time restrictions. Such restrictions may be prohibitive to the implementation of these solutions, since general-purpose processors may not be appropriate to adequately address these constraints. In the last decade, there was an intensification of technical and scientific efforts around hardware acceleration solutions for these operations. Thereby, this work presents an evaluation of different MAC architecture solutions as the main block in the convolution operation. These are architectures that apply optimization techniques to reduce the critical path of the combinational circuit, a metric that is the main focus of this research. Different parametrized architectures were proposed, implemented and evaluated, making use of optimization techniques and optimized blocks previously proposed in the literature. The architectures, which are generic and extensible for n bits, were encoded in VHDL language and evaluated considering pixel widths of 4, 8, 16, 32, and 64 bits. The evaluation was performed by means of logical synthesis in the ASIC technology with the 65nm cell library. In this evaluation, the results were collected and analyzed in relation to the delay, combinational area and dynamic power metrics. Furthermore, a brief analysis for FPGA was performed. One of the proposed architectures, which explores the possibility of using a convolutional neural network previously trained, for inference only, presented up to 37.59% gain in the critical path, in regards to some related architectures, an essential factor for applications with constraints time.As unidades de multiplicação e acumulação (MAC) são básicas para um vasto conjunto de aplicações, como deep learning, processamento digital de sinais, multimídia, entre outras. As operações de convolução, presentes na principal camada de Redes Neurais Convolucionais, respondem por uma parcela significativa do custo computacional inerente à estas redes, atingindo proporções acima de 90\%. A eficiência computacional das aplicações está diretamente relacionada à velocidade dos somadores e multiplicadores usados na unidade MAC. Alguns cenários de aplicação que fazem uso deste tipo de tecnologia, como detecção e classificação de objetos, apresentam fortes restrições temporais. Tais restrições podem ser impeditivas para a implementação destas soluções, uma vez que processadores de propósito geral podem não ser capazes de atender adequadamente à estas restrições. Na última década houve a intensificação dos esforços, técnicos e científicos, em torno de soluções de aceleração em hardware destas operações. Neste sentido, este trabalho apresenta uma avaliação de diferentes soluções de arquiteturas de MACs, como bloco principal na operação convolução. Estas são arquiteturas que aplicam técnicas de otimização para redução do caminho crítico do circuito combinacional, métrica que é foco principal desta pesquisa. Foram propostas, implementadas e avaliadas diferentes arquiteturas parametrizadas, que fazem uso de técnicas de otimização e blocos otimizados, previamente propostos na literatura. As arquiteturas, que são genéricas e extensiveis para n bits, foram codificadas em linguagem VHDL, e avaliadas considerando larguras de pixel de 4, 8, 16, 32, e 64 bits. A avaliação foi realizada por meio de síntese lógica na tecnologia ASIC com a biblioteca de células de 65nm. Nesta avaliação, os resultados foram analisados em relação às métricas de atraso, área combinacional e potência dinâmica. Além disso, uma breve análise para FPGA foi realizada. Uma das arquiteturas propostas, que explora a possibilidade do uso de uma Rede Neural Convolucional previamente treinada, apenas para realização de inferência, apresentou até 37,59% de ganho em caminho crítico, em relação à algumas arquiteturas relacionadas, fator essencial para aplicações com restrições temporais.83 p.\| il., gráfs., tabs.porEngenharia elétricaRedes neurais (Computação)Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPEEL1848-D.pdfPEEL1848-D.pdfapplication/pdf2192504https://repositorio.ufsc.br/bitstream/123456789/206078/-1/PEEL1848-D.pdf43f09b20d4cedf525451f1b9f066bcfaMD5-1123456789/2060782020-03-31 11:43:39.008oai:repositorio.ufsc.br:123456789/206078Repositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732020-03-31T14:43:39Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
title	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
spellingShingle	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais Bonatto, Luana Vieira Martinez Engenharia elétrica Redes neurais (Computação)
title_short	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
title_full	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
title_fullStr	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
title_full_unstemmed	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
title_sort	Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais
author	Bonatto, Luana Vieira Martinez
author_facet	Bonatto, Luana Vieira Martinez
author_role	author
dc.contributor.none.fl_str_mv	Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv	Bonatto, Luana Vieira Martinez
dc.contributor.advisor1.fl_str_mv	Roldán, Héctor Pettenghi
contributor_str_mv	Roldán, Héctor Pettenghi
dc.subject.classification.none.fl_str_mv	Engenharia elétrica Redes neurais (Computação)
topic	Engenharia elétrica Redes neurais (Computação)
description	Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2018.
publishDate	2018
dc.date.issued.fl_str_mv	2018
dc.date.accessioned.fl_str_mv	2020-03-31T14:43:38Z
dc.date.available.fl_str_mv	2020-03-31T14:43:38Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ufsc.br/handle/123456789/206078
dc.identifier.other.none.fl_str_mv	359996
identifier_str_mv	359996
url	https://repositorio.ufsc.br/handle/123456789/206078
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	83 p.\| il., gráfs., tabs.
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC
instname_str	Universidade Federal de Santa Catarina (UFSC)
instacron_str	UFSC
institution	UFSC
reponame_str	Repositório Institucional da UFSC
collection	Repositório Institucional da UFSC
bitstream.url.fl_str_mv	https://repositorio.ufsc.br/bitstream/123456789/206078/-1/PEEL1848-D.pdf
bitstream.checksum.fl_str_mv	43f09b20d4cedf525451f1b9f066bcfa
bitstream.checksumAlgorithm.fl_str_mv	MD5
repository.name.fl_str_mv	Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_	1766805037525237760

Avaliação de arquiteturas de hardware para acelerar as operações aritméticas da camada convolucional em redes neurais convolucionais

Registros relacionados