Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes

Detalhes bibliográficos
Autor(a) principal: Becker, Ricardo
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/3018
Resumo: Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutura dos sistemas de transmissão de sinais de voz via redes de pacotes, em essência, sistemas de Voz sobre IP (VoIP). Nestes sistemas, foram vistas a aplicabilidade e princípios de funcionamento dos componentes de DSP, desde a própria compressão da voz, baseada nos períodos de silêncio, bem como padrões de codificação, cancelamento de eco, controle automático de ganho e geração de ruído de conforto. Posteriormente é proposta então a implementação de seis técnicas de compressão de voz baseadas na combinação de diferentes algoritmos aplicados na detecção de períodos de silêncio ou não da fala. Dentre os algoritmos aplicados, está a análise no tempo e em frequência do conteúdo de energia do sinal de voz, a análise do sinal na busca dos sons fricativos da fala, e ainda aplicação de recobrimento e compensação por ruído de conforto. Para a implementação das técnicas foram desenvolvidas ferramentas computacionais de testes, e para fins de validação e comparação dos resultados foram utilizadas, com as devidas adaptações, e descritas no trabalho, as recomendações P.800 (MOS) e P.862 (PESQ) do ITU-T, sendo estas entre as mais reconhecidas em termos de avaliação da qualidade do sinal de áudio percebido em sistemas de telecomunicações. Por fim, são apresentados os resultados e as conclusões, onde nos mesmos buscava-se um compromisso das implementações entre percentual estimado de economia de banda proporcionada a redes de pacotes, e nível de degradação do sinal de voz proporcionado pela aplicação da compressão, ao mesmo tempo em que sem comprometimento com alta demanda computacional do sistema. Neste sentido, se verificou que em termos de economia de banda proporcionada e qualidade do áudio, as técnicas LSED, SFD e CVAD, todas implementadas no domínio frequência, apresentaram resultados bastante satisfatórios, assim como a LED e ALED, implementadas no domínio do tempo, que também não ficaram muito atrás em termos de resultados gerais. Também ficou claro o efeito da aplicação do recobrimento e da compensação por ruído de conforto amostrado do próprio microfone do locutor. Por fim, sugere-se um número de possibilidades para a continuidade do trabalho, bem como evolução dos mesmos, tanto em termos de melhorias quanto na diversificação das aplicações dos resultados.
id P_RS_7c1d6d0719b2ea2236f6fcaaf0204796
oai_identifier_str oai:tede2.pucrs.br:tede/3018
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Fagundes, Rubem Dutra RibeiroCPF:43036139087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9CPF:96988967087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4753537P6Becker, Ricardo2015-04-14T13:56:16Z2011-08-082009-04-29BECKER, Ricardo. Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes. 2009. 142 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2009.http://tede2.pucrs.br/tede2/handle/tede/3018Made available in DSpace on 2015-04-14T13:56:16Z (GMT). No. of bitstreams: 1 414179.pdf: 2446042 bytes, checksum: f224eb8f5b4a233f7ee4f71ce3cea540 (MD5) Previous issue date: 2009-04-29Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutura dos sistemas de transmissão de sinais de voz via redes de pacotes, em essência, sistemas de Voz sobre IP (VoIP). Nestes sistemas, foram vistas a aplicabilidade e princípios de funcionamento dos componentes de DSP, desde a própria compressão da voz, baseada nos períodos de silêncio, bem como padrões de codificação, cancelamento de eco, controle automático de ganho e geração de ruído de conforto. Posteriormente é proposta então a implementação de seis técnicas de compressão de voz baseadas na combinação de diferentes algoritmos aplicados na detecção de períodos de silêncio ou não da fala. Dentre os algoritmos aplicados, está a análise no tempo e em frequência do conteúdo de energia do sinal de voz, a análise do sinal na busca dos sons fricativos da fala, e ainda aplicação de recobrimento e compensação por ruído de conforto. Para a implementação das técnicas foram desenvolvidas ferramentas computacionais de testes, e para fins de validação e comparação dos resultados foram utilizadas, com as devidas adaptações, e descritas no trabalho, as recomendações P.800 (MOS) e P.862 (PESQ) do ITU-T, sendo estas entre as mais reconhecidas em termos de avaliação da qualidade do sinal de áudio percebido em sistemas de telecomunicações. Por fim, são apresentados os resultados e as conclusões, onde nos mesmos buscava-se um compromisso das implementações entre percentual estimado de economia de banda proporcionada a redes de pacotes, e nível de degradação do sinal de voz proporcionado pela aplicação da compressão, ao mesmo tempo em que sem comprometimento com alta demanda computacional do sistema. Neste sentido, se verificou que em termos de economia de banda proporcionada e qualidade do áudio, as técnicas LSED, SFD e CVAD, todas implementadas no domínio frequência, apresentaram resultados bastante satisfatórios, assim como a LED e ALED, implementadas no domínio do tempo, que também não ficaram muito atrás em termos de resultados gerais. Também ficou claro o efeito da aplicação do recobrimento e da compensação por ruído de conforto amostrado do próprio microfone do locutor. Por fim, sugere-se um número de possibilidades para a continuidade do trabalho, bem como evolução dos mesmos, tanto em termos de melhorias quanto na diversificação das aplicações dos resultados.application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/11243/414179.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Engenharia ElétricaPUCRSBRFaculdade de EngenhariaENGENHARIA ELÉTRICAPROCESSAMENTO DE SINAIS - TÉCNICAS DIGITAISTRANSMISSÃO DE SINAISALGORITMOSPROCESSAMENTO DE VOZCNPQ::ENGENHARIASAnálise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis207662918905964549500600-655770572761439785info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL414179.pdf.jpg414179.pdf.jpgimage/jpeg3277http://tede2.pucrs.br/tede2/bitstream/tede/3018/3/414179.pdf.jpgc7a5d4b0656c8080de261462a7a1c308MD53TEXT414179.pdf.txt414179.pdf.txttext/plain245407http://tede2.pucrs.br/tede2/bitstream/tede/3018/2/414179.pdf.txtbf7a5ecc79c41e2bec6851ae76375986MD52ORIGINAL414179.pdfapplication/pdf2446042http://tede2.pucrs.br/tede2/bitstream/tede/3018/1/414179.pdff224eb8f5b4a233f7ee4f71ce3cea540MD51tede/30182015-04-17 16:03:35.295oai:tede2.pucrs.br:tede/3018Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T19:03:35Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
title Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
spellingShingle Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
Becker, Ricardo
ENGENHARIA ELÉTRICA
PROCESSAMENTO DE SINAIS - TÉCNICAS DIGITAIS
TRANSMISSÃO DE SINAIS
ALGORITMOS
PROCESSAMENTO DE VOZ
CNPQ::ENGENHARIAS
title_short Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
title_full Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
title_fullStr Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
title_full_unstemmed Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
title_sort Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
author Becker, Ricardo
author_facet Becker, Ricardo
author_role author
dc.contributor.advisor1.fl_str_mv Fagundes, Rubem Dutra Ribeiro
dc.contributor.advisor1ID.fl_str_mv CPF:43036139087
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525Y9
dc.contributor.authorID.fl_str_mv CPF:96988967087
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4753537P6
dc.contributor.author.fl_str_mv Becker, Ricardo
contributor_str_mv Fagundes, Rubem Dutra Ribeiro
dc.subject.por.fl_str_mv ENGENHARIA ELÉTRICA
PROCESSAMENTO DE SINAIS - TÉCNICAS DIGITAIS
TRANSMISSÃO DE SINAIS
ALGORITMOS
PROCESSAMENTO DE VOZ
topic ENGENHARIA ELÉTRICA
PROCESSAMENTO DE SINAIS - TÉCNICAS DIGITAIS
TRANSMISSÃO DE SINAIS
ALGORITMOS
PROCESSAMENTO DE VOZ
CNPQ::ENGENHARIAS
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS
description Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutura dos sistemas de transmissão de sinais de voz via redes de pacotes, em essência, sistemas de Voz sobre IP (VoIP). Nestes sistemas, foram vistas a aplicabilidade e princípios de funcionamento dos componentes de DSP, desde a própria compressão da voz, baseada nos períodos de silêncio, bem como padrões de codificação, cancelamento de eco, controle automático de ganho e geração de ruído de conforto. Posteriormente é proposta então a implementação de seis técnicas de compressão de voz baseadas na combinação de diferentes algoritmos aplicados na detecção de períodos de silêncio ou não da fala. Dentre os algoritmos aplicados, está a análise no tempo e em frequência do conteúdo de energia do sinal de voz, a análise do sinal na busca dos sons fricativos da fala, e ainda aplicação de recobrimento e compensação por ruído de conforto. Para a implementação das técnicas foram desenvolvidas ferramentas computacionais de testes, e para fins de validação e comparação dos resultados foram utilizadas, com as devidas adaptações, e descritas no trabalho, as recomendações P.800 (MOS) e P.862 (PESQ) do ITU-T, sendo estas entre as mais reconhecidas em termos de avaliação da qualidade do sinal de áudio percebido em sistemas de telecomunicações. Por fim, são apresentados os resultados e as conclusões, onde nos mesmos buscava-se um compromisso das implementações entre percentual estimado de economia de banda proporcionada a redes de pacotes, e nível de degradação do sinal de voz proporcionado pela aplicação da compressão, ao mesmo tempo em que sem comprometimento com alta demanda computacional do sistema. Neste sentido, se verificou que em termos de economia de banda proporcionada e qualidade do áudio, as técnicas LSED, SFD e CVAD, todas implementadas no domínio frequência, apresentaram resultados bastante satisfatórios, assim como a LED e ALED, implementadas no domínio do tempo, que também não ficaram muito atrás em termos de resultados gerais. Também ficou claro o efeito da aplicação do recobrimento e da compensação por ruído de conforto amostrado do próprio microfone do locutor. Por fim, sugere-se um número de possibilidades para a continuidade do trabalho, bem como evolução dos mesmos, tanto em termos de melhorias quanto na diversificação das aplicações dos resultados.
publishDate 2009
dc.date.issued.fl_str_mv 2009-04-29
dc.date.available.fl_str_mv 2011-08-08
dc.date.accessioned.fl_str_mv 2015-04-14T13:56:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BECKER, Ricardo. Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes. 2009. 142 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2009.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/3018
identifier_str_mv BECKER, Ricardo. Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes. 2009. 142 f. Dissertação (Mestrado em Engenharia Elétrica) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2009.
url http://tede2.pucrs.br/tede2/handle/tede/3018
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 207662918905964549
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv -655770572761439785
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Engenharia
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/3018/3/414179.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/3018/2/414179.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/3018/1/414179.pdf
bitstream.checksum.fl_str_mv c7a5d4b0656c8080de261462a7a1c308
bf7a5ecc79c41e2bec6851ae76375986
f224eb8f5b4a233f7ee4f71ce3cea540
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765290363387904