Estimation of the glottal flow from the speech or singing voice

Detalhes bibliográficos
Autor(a) principal: Beleza, Hugo Miguel Ferreira
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/47578
Resumo: Dissertação de mestrado em Bioinformática (área de especialização em Engenharia)
id RCAP_7c2713f1ff7a16349bdf5b543a89778f
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/47578
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Estimation of the glottal flow from the speech or singing voiceEstimação do impulso glótico do discurso ou do cantoImpulso glóticoEstimação do impulso glóticoFiltragem inversaIntegração no domínio das frequênciasEstimação do impulso glótico no domínio das frequênciasGlottal pulseEstimation of the glottal pulseFilterAlgorithmFrequency domain glottal source estimationEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em Bioinformática (área de especialização em Engenharia)O processo de produção humana de voz é, resumidamente, o resultado da convolução entre o sinal de excitação, o impulso glótico, e a resposta impulsiva resultante da função de transferência do trato vocal. Este modelo de produção de voz é frequentemente referido na literatura como um modelo fontefiltro, em que a fonte representa o fluxo de ar que sai dos pulmões e passa pela glote (espaço entre as pregas vocais), e o filtro retrata as ressonâncias do trato vocal e a radiação labial/nasal. Estimar a forma do impulso glótico a partir do sinal de voz é de importância significativa em diversas áreas e aplicações, uma vez que as características de voz relacionadas, por exemplo, com a qualidade da voz, esforço vocal e distúrbios da voz, devem-se, principalmente, ao fluxo glotal. No entanto, este fluxo é um sinal difícil de determinar de forma direta e não invasiva. Ao longo das últimas décadas foram desenvolvidos vários métodos para estimar o impulso glótico mas sem o desenvolvimento de um algoritmo eficiente e automático. A maioria dos métodos desenvolvidos baseia-se num processo designado por filtragem inversa. A filtragem inversa representa a desconvolução, ou seja, procura obter o sinal de entrada aplicando o inverso da função de transferência do trato vocal ao sinal de saída. Apesar da simplicidade do conceito, o processo de filtragem inversa não é simples uma vez que o sinal de saída pode incluir ruído e não é alcançável modelar com precisão as características do filtro do trato vocal. Nesta dissertação apresentamos um novo método de filtragem de um sinal de modo a melhorar um método robusto de estimação da fonte glótica, no domínio das frequências, que usa uma característica de fase baseada nos Atrasos Relativos Normalizados (NRD) dos harmónicos. Este modelo é aplicado a diversos sinais de voz (sintéticos e reais), e os resultados obtidos da estimação do impulso glótico são comparados com os obtidos usando outros métodos analisados no estado da arte com e sem o referido método de filtragem.The human speech production system is, briefly, the result of the convolution between the excitation signal, the glottal pulse, and the impulse response resulting from the transfer function of the vocal tract. This model of voice production is often mentioned in the literature as a source-filter model, where the source represents the flow of the air leaving the lungs and passing through the glottis (space between the vocal folds), and the filter stands for the resonances of the vocal tract and the lip/nostrils radiation. The estimation of the shape of the glottal pulse from the speech signal is of significant importance in many fields and applications, since the most important features of speech related to voice quality, vocal effort and speech disorders, for example, are mainly due to the voice source. Unfortunately, the glottal flow waveform which is at the origin of the glottal pulse, is a very difficult signal to measure directly and non-invasively. Several methods to achieve the estimation of the glottal flow have been proposed over the last decades, but an efficient and automatic algorithm which performs reliably is not yet available. Most of the developed methods are based on the inverse filtering method. The inverse filtering approach represents a deconvolution process, i.e., it seeks to obtain the source signal by applying the inverse of the vocal tract transfer function to the output speech signal. Despite the simplicity of the concept, the inverse filtering procedure is complex because the output signal may include noise and it is not straightforward to accurately model the characteristics of the vocal tract filter. In this dissertation we discuss a new filtering method for voiced signals with the goal to improve the assessment of a robust frequency-domain algorithm for glottal source estimation that uses a phaserelated feature based on the Normalized Relative Delays (NRDs) of the harmonics. This model is applied to several speech signals (synthetic and real), and the results of the estimation of the glottal pulse are compared with the ones obtained using other state-of-the-art methods with and without the presence of that filtering method.Mendes, RuiFerreira, AníbalUniversidade do MinhoBeleza, Hugo Miguel Ferreira2016-03-032016-03-03T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/47578eng201601095info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:21:58Zoai:repositorium.sdum.uminho.pt:1822/47578Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:15:22.661446Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Estimation of the glottal flow from the speech or singing voice
Estimação do impulso glótico do discurso ou do canto
title Estimation of the glottal flow from the speech or singing voice
spellingShingle Estimation of the glottal flow from the speech or singing voice
Beleza, Hugo Miguel Ferreira
Impulso glótico
Estimação do impulso glótico
Filtragem inversa
Integração no domínio das frequências
Estimação do impulso glótico no domínio das frequências
Glottal pulse
Estimation of the glottal pulse
Filter
Algorithm
Frequency domain glottal source estimation
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Estimation of the glottal flow from the speech or singing voice
title_full Estimation of the glottal flow from the speech or singing voice
title_fullStr Estimation of the glottal flow from the speech or singing voice
title_full_unstemmed Estimation of the glottal flow from the speech or singing voice
title_sort Estimation of the glottal flow from the speech or singing voice
author Beleza, Hugo Miguel Ferreira
author_facet Beleza, Hugo Miguel Ferreira
author_role author
dc.contributor.none.fl_str_mv Mendes, Rui
Ferreira, Aníbal
Universidade do Minho
dc.contributor.author.fl_str_mv Beleza, Hugo Miguel Ferreira
dc.subject.por.fl_str_mv Impulso glótico
Estimação do impulso glótico
Filtragem inversa
Integração no domínio das frequências
Estimação do impulso glótico no domínio das frequências
Glottal pulse
Estimation of the glottal pulse
Filter
Algorithm
Frequency domain glottal source estimation
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Impulso glótico
Estimação do impulso glótico
Filtragem inversa
Integração no domínio das frequências
Estimação do impulso glótico no domínio das frequências
Glottal pulse
Estimation of the glottal pulse
Filter
Algorithm
Frequency domain glottal source estimation
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática (área de especialização em Engenharia)
publishDate 2016
dc.date.none.fl_str_mv 2016-03-03
2016-03-03T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/47578
url http://hdl.handle.net/1822/47578
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 201601095
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132599278370816