Otimização de rede neural em ARM32
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/225936 |
Resumo: | Este trabalho visa o desenvolvimento de um sistema para processamento de modelos de redes neurais do tipo feedforward em ponto flutuante e modelos quantizados em ponto fixo de 32, 16, 8 e 4 bits de precisão em um microcontrolador ARM Cortex M4. O trabalho teve como objetivo avaliar as vantagens e desvantagens do processamento do algoritmo de forward propagation em diferentes precisões com relação ao consumo energético, alocação de memória, velocidade de processamento e erro de quantização. Além disso foi executado um algoritmo de otimização sobre uma rede neural de regressão para obter hiperparâmetros que minimizam a função custo respeitando os limites de memória estabelecidos. A implementação foi desenvolvida, inicialmente, em um computador e, em sequência, foi adaptada para ser processada em microcontrolador utilizando a biblioteca CMSIS DSP. Os resultados obtidos da implementação foram testados com um dataset aberto e foi possível verificar algumas vantagens da inferência em ponto fixo signed de 16 e 8 bits em relação ao ponto flutuante. Contudo, o algoritmo implementado em ponto flutuante se mostrou superior em velocidade de processamento e consumo energético. |
id |
UFRGS-2_1b6af6cf37edb97abb1a482b86066b19 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/225936 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Tcacenco, Filipe dos Santos AdamiCunha, Carlo Requiao da2021-08-20T04:09:20Z2021http://hdl.handle.net/10183/225936001128780Este trabalho visa o desenvolvimento de um sistema para processamento de modelos de redes neurais do tipo feedforward em ponto flutuante e modelos quantizados em ponto fixo de 32, 16, 8 e 4 bits de precisão em um microcontrolador ARM Cortex M4. O trabalho teve como objetivo avaliar as vantagens e desvantagens do processamento do algoritmo de forward propagation em diferentes precisões com relação ao consumo energético, alocação de memória, velocidade de processamento e erro de quantização. Além disso foi executado um algoritmo de otimização sobre uma rede neural de regressão para obter hiperparâmetros que minimizam a função custo respeitando os limites de memória estabelecidos. A implementação foi desenvolvida, inicialmente, em um computador e, em sequência, foi adaptada para ser processada em microcontrolador utilizando a biblioteca CMSIS DSP. Os resultados obtidos da implementação foram testados com um dataset aberto e foi possível verificar algumas vantagens da inferência em ponto fixo signed de 16 e 8 bits em relação ao ponto flutuante. Contudo, o algoritmo implementado em ponto flutuante se mostrou superior em velocidade de processamento e consumo energético.application/pdfporRedes neuraisSistemas embarcadosMicrocontroladoresOtimizaçãoOtimização de rede neural em ARM32info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de FísicaPorto Alegre, BR-RS2021Engenharia Físicagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001128780.pdf.txt001128780.pdf.txtExtracted Texttext/plain84952http://www.lume.ufrgs.br/bitstream/10183/225936/2/001128780.pdf.txt305e901acb67bbb71f3e421d930e979cMD52ORIGINAL001128780.pdfTexto completoapplication/pdf2259714http://www.lume.ufrgs.br/bitstream/10183/225936/1/001128780.pdf4a7b81630a1c6b70e571ac7712858f72MD5110183/2259362021-09-18 04:40:29.889882oai:www.lume.ufrgs.br:10183/225936Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2021-09-18T07:40:29Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Otimização de rede neural em ARM32 |
title |
Otimização de rede neural em ARM32 |
spellingShingle |
Otimização de rede neural em ARM32 Tcacenco, Filipe dos Santos Adami Redes neurais Sistemas embarcados Microcontroladores Otimização |
title_short |
Otimização de rede neural em ARM32 |
title_full |
Otimização de rede neural em ARM32 |
title_fullStr |
Otimização de rede neural em ARM32 |
title_full_unstemmed |
Otimização de rede neural em ARM32 |
title_sort |
Otimização de rede neural em ARM32 |
author |
Tcacenco, Filipe dos Santos Adami |
author_facet |
Tcacenco, Filipe dos Santos Adami |
author_role |
author |
dc.contributor.author.fl_str_mv |
Tcacenco, Filipe dos Santos Adami |
dc.contributor.advisor1.fl_str_mv |
Cunha, Carlo Requiao da |
contributor_str_mv |
Cunha, Carlo Requiao da |
dc.subject.por.fl_str_mv |
Redes neurais Sistemas embarcados Microcontroladores Otimização |
topic |
Redes neurais Sistemas embarcados Microcontroladores Otimização |
description |
Este trabalho visa o desenvolvimento de um sistema para processamento de modelos de redes neurais do tipo feedforward em ponto flutuante e modelos quantizados em ponto fixo de 32, 16, 8 e 4 bits de precisão em um microcontrolador ARM Cortex M4. O trabalho teve como objetivo avaliar as vantagens e desvantagens do processamento do algoritmo de forward propagation em diferentes precisões com relação ao consumo energético, alocação de memória, velocidade de processamento e erro de quantização. Além disso foi executado um algoritmo de otimização sobre uma rede neural de regressão para obter hiperparâmetros que minimizam a função custo respeitando os limites de memória estabelecidos. A implementação foi desenvolvida, inicialmente, em um computador e, em sequência, foi adaptada para ser processada em microcontrolador utilizando a biblioteca CMSIS DSP. Os resultados obtidos da implementação foram testados com um dataset aberto e foi possível verificar algumas vantagens da inferência em ponto fixo signed de 16 e 8 bits em relação ao ponto flutuante. Contudo, o algoritmo implementado em ponto flutuante se mostrou superior em velocidade de processamento e consumo energético. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-08-20T04:09:20Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/225936 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001128780 |
url |
http://hdl.handle.net/10183/225936 |
identifier_str_mv |
001128780 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/225936/2/001128780.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/225936/1/001128780.pdf |
bitstream.checksum.fl_str_mv |
305e901acb67bbb71f3e421d930e979c 4a7b81630a1c6b70e571ac7712858f72 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224611838296064 |