Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Outros Autores: | |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | https://app.uff.br/riuff/handle/1/8059 |
Resumo: | Pode-se dizer que a fala é o principal meio de comunicação do ser humano, e cada indivíduo apresenta características únicas no seu sinal de voz, tornando-a uma assinatura. Dessa forma, a voz pode ser usada como meio de autenticação, por exemplo, para acesso a sistemas de segurança. Neste trabalho, será apresentado o aperfeiçoamento de um programa de verificação de locutor que usa parâmetros do sinal de voz, como os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients, MFCCs) e, também, parâmetros de tempo e de frequência do sinal glotal (sinal obtido imediatamente após a passagem do ar pelas cordas vocais). Esses parâmetros são entradas para HMMs (Modelos Ocultos de Markov-Hidden Markov Models) permitindo a construção de um modelo estocástico para a voz do locutor. Duas grandes contribuições são obtidas com esse trabalho: a adição de novos parâmetros de tempo extraídos do sinal glotal e, principalmente, a utilização de palavras completas, considerando sons vozeados e não vozeados na mesma palavra. Os resultados obtidos com a adição dos novos parâmetros de tempo mostraram melhora no sistema de verificação e a adaptação do programa para palavras completas mostram ser possível a consideração dos parâmetros do sinal glotal para a melhora do sistema de verificação, não apenas para sons vozeados, como anteriormente, mas também para sons não-vozeados, considerado como o grande diferencial do trabalho |
id |
UFF-2_8e75be1d1c405f0569cbf11723c8cc46 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/8059 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeadosMFCCHMMSinal de vozVerificação de locutorPalavras completasSistema de telecomunicaçãoSinal glotalGlottal signalVoice signalSpeaker verificationComplete wordsPode-se dizer que a fala é o principal meio de comunicação do ser humano, e cada indivíduo apresenta características únicas no seu sinal de voz, tornando-a uma assinatura. Dessa forma, a voz pode ser usada como meio de autenticação, por exemplo, para acesso a sistemas de segurança. Neste trabalho, será apresentado o aperfeiçoamento de um programa de verificação de locutor que usa parâmetros do sinal de voz, como os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients, MFCCs) e, também, parâmetros de tempo e de frequência do sinal glotal (sinal obtido imediatamente após a passagem do ar pelas cordas vocais). Esses parâmetros são entradas para HMMs (Modelos Ocultos de Markov-Hidden Markov Models) permitindo a construção de um modelo estocástico para a voz do locutor. Duas grandes contribuições são obtidas com esse trabalho: a adição de novos parâmetros de tempo extraídos do sinal glotal e, principalmente, a utilização de palavras completas, considerando sons vozeados e não vozeados na mesma palavra. Os resultados obtidos com a adição dos novos parâmetros de tempo mostraram melhora no sistema de verificação e a adaptação do programa para palavras completas mostram ser possível a consideração dos parâmetros do sinal glotal para a melhora do sistema de verificação, não apenas para sons vozeados, como anteriormente, mas também para sons não-vozeados, considerado como o grande diferencial do trabalhoOne can say that speech is the main means of communication of human beings and the voice of each person has particular characteristics which turns it into a signature. Consequently, voice signals can be used as authentication, for example, to access security systems. In this work, the improvement of a speaker verification system is presented using parameters extracted from the voice signal, as the MFCCs (Mel Frequency Cepstrum Coefficients) and also time and frequency parameters extracted from the glottal signal (signal obtained immediately after airflow passing through the vocal folds). These parameters are inputs for HMMs (Hidden Markov Models) allowing the construction of a stochastic model of the speaker voice. Two great contributions are obtained with this work: the additon of new time parameters extracted from the glottal signal and, mainly, the use of complete words, considering voiced and unvoiced sounds in the same word. The results obtained with the adding of the new parameters showed improvement in the verification system. The adaptation of the program for complete words showed it is possible to consider the glottal signal parameters to improve the system, not only voiced sounds, as previously done, but also unvoiced sounds, considered the greater differential of the workUniversidade Federal FluminenseNiteróiFerreira, Edson Luiz CataldoCarvalho, Murilo Bresciani deFerreira, Tadeu NagashimaSantos, Raiane Lima dosd’Oliveira, Renato Ramos2018-12-20T12:50:21Z2018-12-20T12:50:21Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSantos, Raine Lima dos; d'Oliveira, Renato Ramos. Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados. 2018. 113 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Departamento de Engenharia de Telecomunicações, Universidade Federal Fluminense, 2018.https://app.uff.br/riuff/handle/1/8059Aluno de Graduaçãohttp://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-05-10T17:48:02Zoai:app.uff.br:1/8059Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202022-05-10T17:48:02Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
title |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
spellingShingle |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados Santos, Raiane Lima dos MFCC HMM Sinal de voz Verificação de locutor Palavras completas Sistema de telecomunicação Sinal glotal Glottal signal Voice signal Speaker verification Complete words |
title_short |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
title_full |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
title_fullStr |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
title_full_unstemmed |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
title_sort |
Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados |
author |
Santos, Raiane Lima dos |
author_facet |
Santos, Raiane Lima dos d’Oliveira, Renato Ramos |
author_role |
author |
author2 |
d’Oliveira, Renato Ramos |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Ferreira, Edson Luiz Cataldo Carvalho, Murilo Bresciani de Ferreira, Tadeu Nagashima |
dc.contributor.author.fl_str_mv |
Santos, Raiane Lima dos d’Oliveira, Renato Ramos |
dc.subject.por.fl_str_mv |
MFCC HMM Sinal de voz Verificação de locutor Palavras completas Sistema de telecomunicação Sinal glotal Glottal signal Voice signal Speaker verification Complete words |
topic |
MFCC HMM Sinal de voz Verificação de locutor Palavras completas Sistema de telecomunicação Sinal glotal Glottal signal Voice signal Speaker verification Complete words |
description |
Pode-se dizer que a fala é o principal meio de comunicação do ser humano, e cada indivíduo apresenta características únicas no seu sinal de voz, tornando-a uma assinatura. Dessa forma, a voz pode ser usada como meio de autenticação, por exemplo, para acesso a sistemas de segurança. Neste trabalho, será apresentado o aperfeiçoamento de um programa de verificação de locutor que usa parâmetros do sinal de voz, como os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients, MFCCs) e, também, parâmetros de tempo e de frequência do sinal glotal (sinal obtido imediatamente após a passagem do ar pelas cordas vocais). Esses parâmetros são entradas para HMMs (Modelos Ocultos de Markov-Hidden Markov Models) permitindo a construção de um modelo estocástico para a voz do locutor. Duas grandes contribuições são obtidas com esse trabalho: a adição de novos parâmetros de tempo extraídos do sinal glotal e, principalmente, a utilização de palavras completas, considerando sons vozeados e não vozeados na mesma palavra. Os resultados obtidos com a adição dos novos parâmetros de tempo mostraram melhora no sistema de verificação e a adaptação do programa para palavras completas mostram ser possível a consideração dos parâmetros do sinal glotal para a melhora do sistema de verificação, não apenas para sons vozeados, como anteriormente, mas também para sons não-vozeados, considerado como o grande diferencial do trabalho |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-12-20T12:50:21Z 2018-12-20T12:50:21Z 2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
Santos, Raine Lima dos; d'Oliveira, Renato Ramos. Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados. 2018. 113 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Departamento de Engenharia de Telecomunicações, Universidade Federal Fluminense, 2018. https://app.uff.br/riuff/handle/1/8059 Aluno de Graduação |
identifier_str_mv |
Santos, Raine Lima dos; d'Oliveira, Renato Ramos. Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraídos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados. 2018. 113 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Departamento de Engenharia de Telecomunicações, Universidade Federal Fluminense, 2018. Aluno de Graduação |
url |
https://app.uff.br/riuff/handle/1/8059 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal Fluminense Niterói |
publisher.none.fl_str_mv |
Universidade Federal Fluminense Niterói |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1807838833421582336 |