Transform co-processor for AV1 video coding standard

Detalhes bibliográficos
Autor(a) principal: Inocêncio, Miguel Oliveira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/29716
Resumo: This dissertation presents a study made of the video coding standard AV1. The research provides statistical results referring to various encoding options, such as the most commonly used Transform kernel, vector sizes, the number of bits used in cosine approximations, amongst others. With the gathered results, optimization measures were implemented on the reference encoder, achieving a 3% decrease in the total encoding time, with 81% reduction in the memory used to store cosine coefficients. The algorithm implemented in software was then described in VHDL, obtaining two implementable architectures. The first allows a high degree of parallelization, obtaining all transformed vector sizes within 22 clock cycles, being able to maintain FHD video at 30 frames per second, at an operating frequency of 187 MHz. The second minimizes the amount of logic, although it does not allow the calculation of multiple vector sizes in parallel. This implementation was synthesized and tested on a Nexys 4 board, occupying 79.93% of total FPGA area and 50 mW consumption. On the hardware kit on which it was implemented, this architecture is able to process HD video at 30 frames per second.
id RCAP_262580bd7e7bcd64a29ada6357baa1a1
oai_identifier_str oai:ria.ua.pt:10773/29716
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Transform co-processor for AV1 video coding standardVideo CodingAV1Transform CodingDCTFPGAThis dissertation presents a study made of the video coding standard AV1. The research provides statistical results referring to various encoding options, such as the most commonly used Transform kernel, vector sizes, the number of bits used in cosine approximations, amongst others. With the gathered results, optimization measures were implemented on the reference encoder, achieving a 3% decrease in the total encoding time, with 81% reduction in the memory used to store cosine coefficients. The algorithm implemented in software was then described in VHDL, obtaining two implementable architectures. The first allows a high degree of parallelization, obtaining all transformed vector sizes within 22 clock cycles, being able to maintain FHD video at 30 frames per second, at an operating frequency of 187 MHz. The second minimizes the amount of logic, although it does not allow the calculation of multiple vector sizes in parallel. This implementation was synthesized and tested on a Nexys 4 board, occupying 79.93% of total FPGA area and 50 mW consumption. On the hardware kit on which it was implemented, this architecture is able to process HD video at 30 frames per second.Esta dissertação apresenta o estudo efetuado sob o formato de compressão de vídeo AV1. A investigação realizada resultou em dados estatísticos referentes a diversas opções de codificação, tais como o kernel da transformada mais utilizado, os tamanhos de vetores utilizados, o número de bits utilizado nas aproximações de cossenos, entre outros. Com os resultados obtidos, foram implementadas medidas de otimização no codificador de referência, obtendo-se uma melhoria de 3% no tempo total de codificação, com uma redução de 81% na utilização de memória dedicada às aproximações do cosseno. O algoritmo implementado em software foi de seguida descrito em VHDL, tendo sido obtidas duas soluções. A primeira permite um elevado grau de paralelização, obtendo todos os diferentes tamanhos de vetores transformados em 22 ciclos de relógio, sendo capaz de codificar vídeo FHD a 30 imagens por segundo, com uma frequência de operação de 187 MHz. A segunda minimiza a utilização de lógica, a custo de não permitir o cálculo de vários tamanhos de vetores simultaneamente. Esta última solução foi sintetizada e testada numa placa Nexys 4, ocupando 79.93% da área total da FPGA e 50 mW de potência consumida. No kit de hardware no qual foi implementada, esta arquitetura ´e capaz de processar vídeo HD a 30 imagens por segundo.2020-11-05T09:37:59Z2019-12-01T00:00:00Z2019-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/29716engInocêncio, Miguel Oliveirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:57:30Zoai:ria.ua.pt:10773/29716Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:01:58.690707Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Transform co-processor for AV1 video coding standard
title Transform co-processor for AV1 video coding standard
spellingShingle Transform co-processor for AV1 video coding standard
Inocêncio, Miguel Oliveira
Video Coding
AV1
Transform Coding
DCT
FPGA
title_short Transform co-processor for AV1 video coding standard
title_full Transform co-processor for AV1 video coding standard
title_fullStr Transform co-processor for AV1 video coding standard
title_full_unstemmed Transform co-processor for AV1 video coding standard
title_sort Transform co-processor for AV1 video coding standard
author Inocêncio, Miguel Oliveira
author_facet Inocêncio, Miguel Oliveira
author_role author
dc.contributor.author.fl_str_mv Inocêncio, Miguel Oliveira
dc.subject.por.fl_str_mv Video Coding
AV1
Transform Coding
DCT
FPGA
topic Video Coding
AV1
Transform Coding
DCT
FPGA
description This dissertation presents a study made of the video coding standard AV1. The research provides statistical results referring to various encoding options, such as the most commonly used Transform kernel, vector sizes, the number of bits used in cosine approximations, amongst others. With the gathered results, optimization measures were implemented on the reference encoder, achieving a 3% decrease in the total encoding time, with 81% reduction in the memory used to store cosine coefficients. The algorithm implemented in software was then described in VHDL, obtaining two implementable architectures. The first allows a high degree of parallelization, obtaining all transformed vector sizes within 22 clock cycles, being able to maintain FHD video at 30 frames per second, at an operating frequency of 187 MHz. The second minimizes the amount of logic, although it does not allow the calculation of multiple vector sizes in parallel. This implementation was synthesized and tested on a Nexys 4 board, occupying 79.93% of total FPGA area and 50 mW consumption. On the hardware kit on which it was implemented, this architecture is able to process HD video at 30 frames per second.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-01T00:00:00Z
2019-12
2020-11-05T09:37:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/29716
url http://hdl.handle.net/10773/29716
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137675403329536