Aproximando a transformada discreta do cosseno por redes neurais ternárias

Detalhes bibliográficos
Autor(a) principal: Torres, Marcelo Haider
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/259425
Resumo: Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares.
id UFRGS-2_22649e74e562a57fdf77ebe3f3806a00
oai_identifier_str oai:www.lume.ufrgs.br:10183/259425
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Torres, Marcelo HaiderSilveira, Thiago Lopes Trugillo da2023-06-24T03:39:33Z2023http://hdl.handle.net/10183/259425001171764Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares.Discrete transforms play a fundamental role in signal processing. In particular, the dis crete cosine transform (DCT) is an essential tool for image and video compression. Fast algorithms allow the application of DCT with reduced complexity but require floating point computations. Such conditions can be prohibitive in applications that demand real time response or low-power hardware. Several works formulate an optimization problem in a discrete search space to approximate the computation of the DCT using only opera tions of low arithmetic complexity. Generally, approximate transform coefficients are in (or a subset of) {0, ± 1 2 , ±1, ±2}. This work models the approximate transform propo sition problem by optimizing (training) a multilayer perceptron (MLP) artificial neural network (ANN). Recent mechanisms for training ternary ANNs are used so that orthogo nal 8-point DCT approximations that require only additions/subtractions can be derived. Two well-known transformations in the literature are obtained by the proposed method ology. For evaluation, metrics of coding efficiency and proximity to the exact DCT are used. The obtained DCT approximations are submitted to a JPEG-like image compres sion experiment, where image quality assessment is performed. The results indicate that the proposed methodology allows for deriving transforms with high coding efficiency and low arithmetic complexity. In the future, the proposed methodology will be extended in order to contemplate other transform sizes and other discrete linear transforms.application/pdfengProcessamento de sinaisRede neural artificialImagemVídeoDCT approximationsLow-complexity transformsImage compressionArtificial neural networksMultilayer perceptronAproximando a transformada discreta do cosseno por redes neurais ternáriasAproximating the discrete cosine transform by ternary neural networks info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001171764.pdf.txt001171764.pdf.txtExtracted Texttext/plain75790http://www.lume.ufrgs.br/bitstream/10183/259425/2/001171764.pdf.txt47c58e3027ff555c8f6dd626d46873d4MD52ORIGINAL001171764.pdfTexto completoapplication/pdf2098790http://www.lume.ufrgs.br/bitstream/10183/259425/1/001171764.pdfb0d0b3ac54621370d5cc068ec1838426MD5110183/2594252023-06-25 03:46:00.333482oai:www.lume.ufrgs.br:10183/259425Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-06-25T06:46Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aproximando a transformada discreta do cosseno por redes neurais ternárias
dc.title.alternative.en.fl_str_mv Aproximating the discrete cosine transform by ternary neural networks
title Aproximando a transformada discreta do cosseno por redes neurais ternárias
spellingShingle Aproximando a transformada discreta do cosseno por redes neurais ternárias
Torres, Marcelo Haider
Processamento de sinais
Rede neural artificial
Imagem
Vídeo
DCT approximations
Low-complexity transforms
Image compression
Artificial neural networks
Multilayer perceptron
title_short Aproximando a transformada discreta do cosseno por redes neurais ternárias
title_full Aproximando a transformada discreta do cosseno por redes neurais ternárias
title_fullStr Aproximando a transformada discreta do cosseno por redes neurais ternárias
title_full_unstemmed Aproximando a transformada discreta do cosseno por redes neurais ternárias
title_sort Aproximando a transformada discreta do cosseno por redes neurais ternárias
author Torres, Marcelo Haider
author_facet Torres, Marcelo Haider
author_role author
dc.contributor.author.fl_str_mv Torres, Marcelo Haider
dc.contributor.advisor1.fl_str_mv Silveira, Thiago Lopes Trugillo da
contributor_str_mv Silveira, Thiago Lopes Trugillo da
dc.subject.por.fl_str_mv Processamento de sinais
Rede neural artificial
Imagem
Vídeo
topic Processamento de sinais
Rede neural artificial
Imagem
Vídeo
DCT approximations
Low-complexity transforms
Image compression
Artificial neural networks
Multilayer perceptron
dc.subject.eng.fl_str_mv DCT approximations
Low-complexity transforms
Image compression
Artificial neural networks
Multilayer perceptron
description Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) {0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-06-24T03:39:33Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/259425
dc.identifier.nrb.pt_BR.fl_str_mv 001171764
url http://hdl.handle.net/10183/259425
identifier_str_mv 001171764
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/259425/2/001171764.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/259425/1/001171764.pdf
bitstream.checksum.fl_str_mv 47c58e3027ff555c8f6dd626d46873d4
b0d0b3ac54621370d5cc068ec1838426
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801224662400630784