Aproximando a transformada discreta do cosseno por redes neurais ternárias
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/259425 |
Resumo: | Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares. |
id |
UFRGS-2_22649e74e562a57fdf77ebe3f3806a00 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/259425 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Torres, Marcelo HaiderSilveira, Thiago Lopes Trugillo da2023-06-24T03:39:33Z2023http://hdl.handle.net/10183/259425001171764Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares.Discrete transforms play a fundamental role in signal processing. In particular, the dis crete cosine transform (DCT) is an essential tool for image and video compression. Fast algorithms allow the application of DCT with reduced complexity but require floating point computations. Such conditions can be prohibitive in applications that demand real time response or low-power hardware. Several works formulate an optimization problem in a discrete search space to approximate the computation of the DCT using only opera tions of low arithmetic complexity. Generally, approximate transform coefficients are in (or a subset of) {0, ± 1 2 , ±1, ±2}. This work models the approximate transform propo sition problem by optimizing (training) a multilayer perceptron (MLP) artificial neural network (ANN). Recent mechanisms for training ternary ANNs are used so that orthogo nal 8-point DCT approximations that require only additions/subtractions can be derived. Two well-known transformations in the literature are obtained by the proposed method ology. For evaluation, metrics of coding efficiency and proximity to the exact DCT are used. The obtained DCT approximations are submitted to a JPEG-like image compres sion experiment, where image quality assessment is performed. The results indicate that the proposed methodology allows for deriving transforms with high coding efficiency and low arithmetic complexity. In the future, the proposed methodology will be extended in order to contemplate other transform sizes and other discrete linear transforms.application/pdfengProcessamento de sinaisRede neural artificialImagemVídeoDCT approximationsLow-complexity transformsImage compressionArtificial neural networksMultilayer perceptronAproximando a transformada discreta do cosseno por redes neurais ternáriasAproximating the discrete cosine transform by ternary neural networks info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001171764.pdf.txt001171764.pdf.txtExtracted Texttext/plain75790http://www.lume.ufrgs.br/bitstream/10183/259425/2/001171764.pdf.txt47c58e3027ff555c8f6dd626d46873d4MD52ORIGINAL001171764.pdfTexto completoapplication/pdf2098790http://www.lume.ufrgs.br/bitstream/10183/259425/1/001171764.pdfb0d0b3ac54621370d5cc068ec1838426MD5110183/2594252023-06-25 03:46:00.333482oai:www.lume.ufrgs.br:10183/259425Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-06-25T06:46Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
dc.title.alternative.en.fl_str_mv |
Aproximating the discrete cosine transform by ternary neural networks |
title |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
spellingShingle |
Aproximando a transformada discreta do cosseno por redes neurais ternárias Torres, Marcelo Haider Processamento de sinais Rede neural artificial Imagem Vídeo DCT approximations Low-complexity transforms Image compression Artificial neural networks Multilayer perceptron |
title_short |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
title_full |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
title_fullStr |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
title_full_unstemmed |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
title_sort |
Aproximando a transformada discreta do cosseno por redes neurais ternárias |
author |
Torres, Marcelo Haider |
author_facet |
Torres, Marcelo Haider |
author_role |
author |
dc.contributor.author.fl_str_mv |
Torres, Marcelo Haider |
dc.contributor.advisor1.fl_str_mv |
Silveira, Thiago Lopes Trugillo da |
contributor_str_mv |
Silveira, Thiago Lopes Trugillo da |
dc.subject.por.fl_str_mv |
Processamento de sinais Rede neural artificial Imagem Vídeo |
topic |
Processamento de sinais Rede neural artificial Imagem Vídeo DCT approximations Low-complexity transforms Image compression Artificial neural networks Multilayer perceptron |
dc.subject.eng.fl_str_mv |
DCT approximations Low-complexity transforms Image compression Artificial neural networks Multilayer perceptron |
description |
Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-06-24T03:39:33Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/259425 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001171764 |
url |
http://hdl.handle.net/10183/259425 |
identifier_str_mv |
001171764 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/259425/2/001171764.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/259425/1/001171764.pdf |
bitstream.checksum.fl_str_mv |
47c58e3027ff555c8f6dd626d46873d4 b0d0b3ac54621370d5cc068ec1838426 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447343189721088 |