Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz

Detalhes bibliográficos
Autor(a) principal: Wisnevski, Flávio Luis
Data de Publicação: 2011
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/3038
Resumo: Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.
id P_RS_6915fa573f3fa734b18d2987c40c6660
oai_identifier_str oai:tede2.pucrs.br:tede/3038
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Fagundes, Rubem Dutra RibeiroCPF:43036139087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9CPF:91211107000http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4504150Z3Wisnevski, Flávio Luis2015-04-14T13:56:22Z2011-11-072011-08-25WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011.http://tede2.pucrs.br/tede2/handle/tede/3038Made available in DSpace on 2015-04-14T13:56:22Z (GMT). No. of bitstreams: 1 434559.pdf: 4621717 bytes, checksum: c4885f23273153ab3ddd4a325610aa74 (MD5) Previous issue date: 2011-08-25Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/11475/434559.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Engenharia ElétricaPUCRSBRFaculdade de EngenhariaENGENHARIA ELÉTRICATELECOMUNICAÇÕESDECODIFICADORESPROCESSAMENTO DE SINAISPROCESSAMENTO DE VOZALGORITMOSCNPQ::ENGENHARIAS::ENGENHARIA ELETRICACodificador G729a orientado à avaliação da qualidade perceptual do sinal de vozinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis207662918905964549500600-655770572761439785info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL434559.pdf.jpg434559.pdf.jpgimage/jpeg3143http://tede2.pucrs.br/tede2/bitstream/tede/3038/3/434559.pdf.jpgfa6a387c70ae366b303e3e56b18a223eMD53TEXT434559.pdf.txt434559.pdf.txttext/plain160796http://tede2.pucrs.br/tede2/bitstream/tede/3038/2/434559.pdf.txt4767052f6ca6b1424a85c1076c32bac7MD52ORIGINAL434559.pdfapplication/pdf4621717http://tede2.pucrs.br/tede2/bitstream/tede/3038/1/434559.pdfc4885f23273153ab3ddd4a325610aa74MD51tede/30382015-04-17 16:03:35.546oai:tede2.pucrs.br:tede/3038Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T19:03:35Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
title Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
spellingShingle Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
Wisnevski, Flávio Luis
ENGENHARIA ELÉTRICA
TELECOMUNICAÇÕES
DECODIFICADORES
PROCESSAMENTO DE SINAIS
PROCESSAMENTO DE VOZ
ALGORITMOS
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
title_full Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
title_fullStr Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
title_full_unstemmed Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
title_sort Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
author Wisnevski, Flávio Luis
author_facet Wisnevski, Flávio Luis
author_role author
dc.contributor.advisor1.fl_str_mv Fagundes, Rubem Dutra Ribeiro
dc.contributor.advisor1ID.fl_str_mv CPF:43036139087
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9
dc.contributor.authorID.fl_str_mv CPF:91211107000
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4504150Z3
dc.contributor.author.fl_str_mv Wisnevski, Flávio Luis
contributor_str_mv Fagundes, Rubem Dutra Ribeiro
dc.subject.por.fl_str_mv ENGENHARIA ELÉTRICA
TELECOMUNICAÇÕES
DECODIFICADORES
PROCESSAMENTO DE SINAIS
PROCESSAMENTO DE VOZ
ALGORITMOS
topic ENGENHARIA ELÉTRICA
TELECOMUNICAÇÕES
DECODIFICADORES
PROCESSAMENTO DE SINAIS
PROCESSAMENTO DE VOZ
ALGORITMOS
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.
publishDate 2011
dc.date.available.fl_str_mv 2011-11-07
dc.date.issued.fl_str_mv 2011-08-25
dc.date.accessioned.fl_str_mv 2015-04-14T13:56:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/3038
identifier_str_mv WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011.
url http://tede2.pucrs.br/tede2/handle/tede/3038
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 207662918905964549
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv -655770572761439785
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Engenharia
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/3038/3/434559.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/3038/2/434559.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/3038/1/434559.pdf
bitstream.checksum.fl_str_mv fa6a387c70ae366b303e3e56b18a223e
4767052f6ca6b1424a85c1076c32bac7
c4885f23273153ab3ddd4a325610aa74
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765290839441408