Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.

Detalhes bibliográficos
Autor(a) principal: ROCHA, Raíssa Bezerra.
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165
Resumo: Esta dissertação apresenta o desenvolvimento de um codificador de voz que tem como principal característica a transmissão do sinal de voz com baixas taxas de bits. Desenvolvido principalmente para ser utilizado em sistemas móveis celulares, o codificador proposto é do tipo fonético, que entre as técnicas de codificação de sinais de fala é a que permite obter menor taxa de transmissão. Sua implementação está dividida no desenvolvimento do emissor e receptor. No emissor, os sinais de fala são segmentados por meio de um reconhecedor de fonemas que utiliza Modelos de Markov Escondidos (HMMs) para modelar o sinal de voz. A cada fonema é atribuído um índice préestabelecido e sua duração e energia são estimados. A informação transmitida ao receptor consiste no índice, energia e duração de cada fonema. Deste modo, o codificador consegue uma redução na taxa de transmissão do sinal de voz. O receptor é constituído em duas etapas. Na primeira, cada usuário do codificador tem que construir um banco de unidades acústicas por meio da pronúncia de frases pré-estabelecidas. Na segunda etapa, é realizada a síntese por concatenação de segmentos como sílabas, fonemas e encontros vocálicos. Para avaliar o desempenho do codificador foi realizado um teste subjetivo informal baseado no teste ACR (Absolute Category Rating). Duas avaliações foram feitas. A primeira utiliza segmentação automática no emissor e receptor e o codificador permitiu a transmissão do sinal de voz com uma taxa de, no máximo, 150 bits/s. Os resultados da qualidade dos sinais de voz indicam que os avaliadores classificam a maioria deles como de razoável a boa. Na segunda avaliação, a segmentação utilizada para formar o banco de unidades acústicas foi realizada de forma manual. Sessenta e dois ouvintes-avaliadores foram questionados a respeito da inteligibilidade e qualidade dos sinais de voz. Os sinais de voz foram codificados com 125 bits/s e a maior parte deles apresentaram bons níveis de inteligibilidade e foram considerados sinais de fala de qualidade razoável.
id UFCG_1088fa4bd959974a2c44b01baf0fd517
oai_identifier_str oai:localhost:riufcg/8165
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.Development of a low rate personal voice coder based on hidden Markov models.Codificação de VozCodificação FonéticaTaxa de TransmissãoReconhecimento de FonemasTaxa de BitsQualidade de Sinal ReconstruídoComplexidadeRetardo de ComunicaçãoSensibilidade aos Erros de CanalVoice EncodingPhonetic CodingTransmission RatePhoneme RecognitionBit RateRebuilt Signal QualityComplexityCommunication DelaySensitivity to Channel ErrorEngenharia ElétricaEsta dissertação apresenta o desenvolvimento de um codificador de voz que tem como principal característica a transmissão do sinal de voz com baixas taxas de bits. Desenvolvido principalmente para ser utilizado em sistemas móveis celulares, o codificador proposto é do tipo fonético, que entre as técnicas de codificação de sinais de fala é a que permite obter menor taxa de transmissão. Sua implementação está dividida no desenvolvimento do emissor e receptor. No emissor, os sinais de fala são segmentados por meio de um reconhecedor de fonemas que utiliza Modelos de Markov Escondidos (HMMs) para modelar o sinal de voz. A cada fonema é atribuído um índice préestabelecido e sua duração e energia são estimados. A informação transmitida ao receptor consiste no índice, energia e duração de cada fonema. Deste modo, o codificador consegue uma redução na taxa de transmissão do sinal de voz. O receptor é constituído em duas etapas. Na primeira, cada usuário do codificador tem que construir um banco de unidades acústicas por meio da pronúncia de frases pré-estabelecidas. Na segunda etapa, é realizada a síntese por concatenação de segmentos como sílabas, fonemas e encontros vocálicos. Para avaliar o desempenho do codificador foi realizado um teste subjetivo informal baseado no teste ACR (Absolute Category Rating). Duas avaliações foram feitas. A primeira utiliza segmentação automática no emissor e receptor e o codificador permitiu a transmissão do sinal de voz com uma taxa de, no máximo, 150 bits/s. Os resultados da qualidade dos sinais de voz indicam que os avaliadores classificam a maioria deles como de razoável a boa. Na segunda avaliação, a segmentação utilizada para formar o banco de unidades acústicas foi realizada de forma manual. Sessenta e dois ouvintes-avaliadores foram questionados a respeito da inteligibilidade e qualidade dos sinais de voz. Os sinais de voz foram codificados com 125 bits/s e a maior parte deles apresentaram bons níveis de inteligibilidade e foram considerados sinais de fala de qualidade razoável.This dissertation presents the development of a voice encoder which has the transmission of voice signals with low bitrates as its main feature. Developed mainly for utilization in mobile cellular systems, the proposed encoder uses the phonetic coding technique, which provides the lowest transmission rate. Its implementation is divided into the development of the emitter and the receiver. In the emitter, the speech signals are segmented by a phoneme recognizer which utilizes Hidden Markov Models (HMMs) to model the voice signal. A pre-established index is assigned to each phoneme and its duration and energy are estimated. The information transmitted to the receiver consists of the index, energy and duration of each phoneme. This way the encoder achieves a reduction in the voice signal transmission rate. The receiver is constituted in two steps. In the first, each encoder user has to build an acoustic unit bank by pronunciation of pre-established phrases. The second step is a synthesis by concatenation of segments as syllables, phonemes and vowel meetings. To evaluate the performance of the encoder, an informal subjective test based on the ACR (Absolute Category Rating) test was used. Two evaluations were done. The first used automatic segmentation in the emitter and receiver, and the encoder allowed transmission of the voice signal with a rate of up to 150 bits/s. The results of the voice signal quality indicate that the evaluators classified most of the samples as average to good. In the second evaluation the segmentation used to form the acoustic unit bank was done manually. Sixty-two listening evaluators were questioned about the intelligibility and quality of the speech signals. The voice signals were coded using 125 bits/s, and most of them presented good levels of intelligibility and reasonable quality.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGALENCAR, Marcelo Sampaio de.ALENCAR, M. S.http://lattes.cnpq.br/0946722048975388LOPES, Waslon Terlizzie Araújo.BERNARDINO JÚNIOR, Francisco Madeiro.VELOSO, Luciana Ribeiro.ROCHA, Raíssa Bezerra.2012-07-272019-10-17T10:08:42Z2019-10-172019-10-17T10:08:42Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165ROCHA, Raissa Bezerra. Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos. 2012. 129f. (Dissertação) Mestrado em Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Campina Grande - Paraíba - Brasil, 2012.porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2021-06-14T21:37:07Zoai:localhost:riufcg/8165Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-06-14T21:37:07Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
Development of a low rate personal voice coder based on hidden Markov models.
title Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
spellingShingle Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
ROCHA, Raíssa Bezerra.
Codificação de Voz
Codificação Fonética
Taxa de Transmissão
Reconhecimento de Fonemas
Taxa de Bits
Qualidade de Sinal Reconstruído
Complexidade
Retardo de Comunicação
Sensibilidade aos Erros de Canal
Voice Encoding
Phonetic Coding
Transmission Rate
Phoneme Recognition
Bit Rate
Rebuilt Signal Quality
Complexity
Communication Delay
Sensitivity to Channel Error
Engenharia Elétrica
title_short Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
title_full Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
title_fullStr Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
title_full_unstemmed Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
title_sort Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.
author ROCHA, Raíssa Bezerra.
author_facet ROCHA, Raíssa Bezerra.
author_role author
dc.contributor.none.fl_str_mv ALENCAR, Marcelo Sampaio de.
ALENCAR, M. S.
http://lattes.cnpq.br/0946722048975388
LOPES, Waslon Terlizzie Araújo.
BERNARDINO JÚNIOR, Francisco Madeiro.
VELOSO, Luciana Ribeiro.
dc.contributor.author.fl_str_mv ROCHA, Raíssa Bezerra.
dc.subject.por.fl_str_mv Codificação de Voz
Codificação Fonética
Taxa de Transmissão
Reconhecimento de Fonemas
Taxa de Bits
Qualidade de Sinal Reconstruído
Complexidade
Retardo de Comunicação
Sensibilidade aos Erros de Canal
Voice Encoding
Phonetic Coding
Transmission Rate
Phoneme Recognition
Bit Rate
Rebuilt Signal Quality
Complexity
Communication Delay
Sensitivity to Channel Error
Engenharia Elétrica
topic Codificação de Voz
Codificação Fonética
Taxa de Transmissão
Reconhecimento de Fonemas
Taxa de Bits
Qualidade de Sinal Reconstruído
Complexidade
Retardo de Comunicação
Sensibilidade aos Erros de Canal
Voice Encoding
Phonetic Coding
Transmission Rate
Phoneme Recognition
Bit Rate
Rebuilt Signal Quality
Complexity
Communication Delay
Sensitivity to Channel Error
Engenharia Elétrica
description Esta dissertação apresenta o desenvolvimento de um codificador de voz que tem como principal característica a transmissão do sinal de voz com baixas taxas de bits. Desenvolvido principalmente para ser utilizado em sistemas móveis celulares, o codificador proposto é do tipo fonético, que entre as técnicas de codificação de sinais de fala é a que permite obter menor taxa de transmissão. Sua implementação está dividida no desenvolvimento do emissor e receptor. No emissor, os sinais de fala são segmentados por meio de um reconhecedor de fonemas que utiliza Modelos de Markov Escondidos (HMMs) para modelar o sinal de voz. A cada fonema é atribuído um índice préestabelecido e sua duração e energia são estimados. A informação transmitida ao receptor consiste no índice, energia e duração de cada fonema. Deste modo, o codificador consegue uma redução na taxa de transmissão do sinal de voz. O receptor é constituído em duas etapas. Na primeira, cada usuário do codificador tem que construir um banco de unidades acústicas por meio da pronúncia de frases pré-estabelecidas. Na segunda etapa, é realizada a síntese por concatenação de segmentos como sílabas, fonemas e encontros vocálicos. Para avaliar o desempenho do codificador foi realizado um teste subjetivo informal baseado no teste ACR (Absolute Category Rating). Duas avaliações foram feitas. A primeira utiliza segmentação automática no emissor e receptor e o codificador permitiu a transmissão do sinal de voz com uma taxa de, no máximo, 150 bits/s. Os resultados da qualidade dos sinais de voz indicam que os avaliadores classificam a maioria deles como de razoável a boa. Na segunda avaliação, a segmentação utilizada para formar o banco de unidades acústicas foi realizada de forma manual. Sessenta e dois ouvintes-avaliadores foram questionados a respeito da inteligibilidade e qualidade dos sinais de voz. Os sinais de voz foram codificados com 125 bits/s e a maior parte deles apresentaram bons níveis de inteligibilidade e foram considerados sinais de fala de qualidade razoável.
publishDate 2012
dc.date.none.fl_str_mv 2012-07-27
2019-10-17T10:08:42Z
2019-10-17
2019-10-17T10:08:42Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165
ROCHA, Raissa Bezerra. Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos. 2012. 129f. (Dissertação) Mestrado em Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Campina Grande - Paraíba - Brasil, 2012.
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165
identifier_str_mv ROCHA, Raissa Bezerra. Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos. 2012. 129f. (Dissertação) Mestrado em Engenharia Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Campina Grande - Paraíba - Brasil, 2012.
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744404219428864