Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/3038 |
Resumo: | Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec. |
id |
P_RS_6915fa573f3fa734b18d2987c40c6660 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/3038 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Fagundes, Rubem Dutra RibeiroCPF:43036139087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9CPF:91211107000http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4504150Z3Wisnevski, Flávio Luis2015-04-14T13:56:22Z2011-11-072011-08-25WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011.http://tede2.pucrs.br/tede2/handle/tede/3038Made available in DSpace on 2015-04-14T13:56:22Z (GMT). No. of bitstreams: 1 434559.pdf: 4621717 bytes, checksum: c4885f23273153ab3ddd4a325610aa74 (MD5) Previous issue date: 2011-08-25Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/11475/434559.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Engenharia ElétricaPUCRSBRFaculdade de EngenhariaENGENHARIA ELÉTRICATELECOMUNICAÇÕESDECODIFICADORESPROCESSAMENTO DE SINAISPROCESSAMENTO DE VOZALGORITMOSCNPQ::ENGENHARIAS::ENGENHARIA ELETRICACodificador G729a orientado à avaliação da qualidade perceptual do sinal de vozinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis207662918905964549500600-655770572761439785info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL434559.pdf.jpg434559.pdf.jpgimage/jpeg3143http://tede2.pucrs.br/tede2/bitstream/tede/3038/3/434559.pdf.jpgfa6a387c70ae366b303e3e56b18a223eMD53TEXT434559.pdf.txt434559.pdf.txttext/plain160796http://tede2.pucrs.br/tede2/bitstream/tede/3038/2/434559.pdf.txt4767052f6ca6b1424a85c1076c32bac7MD52ORIGINAL434559.pdfapplication/pdf4621717http://tede2.pucrs.br/tede2/bitstream/tede/3038/1/434559.pdfc4885f23273153ab3ddd4a325610aa74MD51tede/30382015-04-17 16:03:35.546oai:tede2.pucrs.br:tede/3038Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T19:03:35Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
title |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
spellingShingle |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz Wisnevski, Flávio Luis ENGENHARIA ELÉTRICA TELECOMUNICAÇÕES DECODIFICADORES PROCESSAMENTO DE SINAIS PROCESSAMENTO DE VOZ ALGORITMOS CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
title_short |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
title_full |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
title_fullStr |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
title_full_unstemmed |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
title_sort |
Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz |
author |
Wisnevski, Flávio Luis |
author_facet |
Wisnevski, Flávio Luis |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Fagundes, Rubem Dutra Ribeiro |
dc.contributor.advisor1ID.fl_str_mv |
CPF:43036139087 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9 |
dc.contributor.authorID.fl_str_mv |
CPF:91211107000 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4504150Z3 |
dc.contributor.author.fl_str_mv |
Wisnevski, Flávio Luis |
contributor_str_mv |
Fagundes, Rubem Dutra Ribeiro |
dc.subject.por.fl_str_mv |
ENGENHARIA ELÉTRICA TELECOMUNICAÇÕES DECODIFICADORES PROCESSAMENTO DE SINAIS PROCESSAMENTO DE VOZ ALGORITMOS |
topic |
ENGENHARIA ELÉTRICA TELECOMUNICAÇÕES DECODIFICADORES PROCESSAMENTO DE SINAIS PROCESSAMENTO DE VOZ ALGORITMOS CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
description |
Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec. |
publishDate |
2011 |
dc.date.available.fl_str_mv |
2011-11-07 |
dc.date.issued.fl_str_mv |
2011-08-25 |
dc.date.accessioned.fl_str_mv |
2015-04-14T13:56:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011. |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/3038 |
identifier_str_mv |
WISNEVSKI, Flávio Luis. Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz. 2011. 126 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2011. |
url |
http://tede2.pucrs.br/tede2/handle/tede/3038 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
207662918905964549 |
dc.relation.confidence.fl_str_mv |
500 600 |
dc.relation.department.fl_str_mv |
-655770572761439785 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Faculdade de Engenharia |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/3038/3/434559.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/3038/2/434559.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/3038/1/434559.pdf |
bitstream.checksum.fl_str_mv |
fa6a387c70ae366b303e3e56b18a223e 4767052f6ca6b1424a85c1076c32bac7 c4885f23273153ab3ddd4a325610aa74 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765290839441408 |