Estimation of the glottal flow from the speech or singing voice
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/47578 |
Resumo: | Dissertação de mestrado em Bioinformática (área de especialização em Engenharia) |
id |
RCAP_7c2713f1ff7a16349bdf5b543a89778f |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/47578 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Estimation of the glottal flow from the speech or singing voiceEstimação do impulso glótico do discurso ou do cantoImpulso glóticoEstimação do impulso glóticoFiltragem inversaIntegração no domínio das frequênciasEstimação do impulso glótico no domínio das frequênciasGlottal pulseEstimation of the glottal pulseFilterAlgorithmFrequency domain glottal source estimationEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em Bioinformática (área de especialização em Engenharia)O processo de produção humana de voz é, resumidamente, o resultado da convolução entre o sinal de excitação, o impulso glótico, e a resposta impulsiva resultante da função de transferência do trato vocal. Este modelo de produção de voz é frequentemente referido na literatura como um modelo fontefiltro, em que a fonte representa o fluxo de ar que sai dos pulmões e passa pela glote (espaço entre as pregas vocais), e o filtro retrata as ressonâncias do trato vocal e a radiação labial/nasal. Estimar a forma do impulso glótico a partir do sinal de voz é de importância significativa em diversas áreas e aplicações, uma vez que as características de voz relacionadas, por exemplo, com a qualidade da voz, esforço vocal e distúrbios da voz, devem-se, principalmente, ao fluxo glotal. No entanto, este fluxo é um sinal difícil de determinar de forma direta e não invasiva. Ao longo das últimas décadas foram desenvolvidos vários métodos para estimar o impulso glótico mas sem o desenvolvimento de um algoritmo eficiente e automático. A maioria dos métodos desenvolvidos baseia-se num processo designado por filtragem inversa. A filtragem inversa representa a desconvolução, ou seja, procura obter o sinal de entrada aplicando o inverso da função de transferência do trato vocal ao sinal de saída. Apesar da simplicidade do conceito, o processo de filtragem inversa não é simples uma vez que o sinal de saída pode incluir ruído e não é alcançável modelar com precisão as características do filtro do trato vocal. Nesta dissertação apresentamos um novo método de filtragem de um sinal de modo a melhorar um método robusto de estimação da fonte glótica, no domínio das frequências, que usa uma característica de fase baseada nos Atrasos Relativos Normalizados (NRD) dos harmónicos. Este modelo é aplicado a diversos sinais de voz (sintéticos e reais), e os resultados obtidos da estimação do impulso glótico são comparados com os obtidos usando outros métodos analisados no estado da arte com e sem o referido método de filtragem.The human speech production system is, briefly, the result of the convolution between the excitation signal, the glottal pulse, and the impulse response resulting from the transfer function of the vocal tract. This model of voice production is often mentioned in the literature as a source-filter model, where the source represents the flow of the air leaving the lungs and passing through the glottis (space between the vocal folds), and the filter stands for the resonances of the vocal tract and the lip/nostrils radiation. The estimation of the shape of the glottal pulse from the speech signal is of significant importance in many fields and applications, since the most important features of speech related to voice quality, vocal effort and speech disorders, for example, are mainly due to the voice source. Unfortunately, the glottal flow waveform which is at the origin of the glottal pulse, is a very difficult signal to measure directly and non-invasively. Several methods to achieve the estimation of the glottal flow have been proposed over the last decades, but an efficient and automatic algorithm which performs reliably is not yet available. Most of the developed methods are based on the inverse filtering method. The inverse filtering approach represents a deconvolution process, i.e., it seeks to obtain the source signal by applying the inverse of the vocal tract transfer function to the output speech signal. Despite the simplicity of the concept, the inverse filtering procedure is complex because the output signal may include noise and it is not straightforward to accurately model the characteristics of the vocal tract filter. In this dissertation we discuss a new filtering method for voiced signals with the goal to improve the assessment of a robust frequency-domain algorithm for glottal source estimation that uses a phaserelated feature based on the Normalized Relative Delays (NRDs) of the harmonics. This model is applied to several speech signals (synthetic and real), and the results of the estimation of the glottal pulse are compared with the ones obtained using other state-of-the-art methods with and without the presence of that filtering method.Mendes, RuiFerreira, AníbalUniversidade do MinhoBeleza, Hugo Miguel Ferreira2016-03-032016-03-03T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/47578eng201601095info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:21:58Zoai:repositorium.sdum.uminho.pt:1822/47578Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:15:22.661446Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Estimation of the glottal flow from the speech or singing voice Estimação do impulso glótico do discurso ou do canto |
title |
Estimation of the glottal flow from the speech or singing voice |
spellingShingle |
Estimation of the glottal flow from the speech or singing voice Beleza, Hugo Miguel Ferreira Impulso glótico Estimação do impulso glótico Filtragem inversa Integração no domínio das frequências Estimação do impulso glótico no domínio das frequências Glottal pulse Estimation of the glottal pulse Filter Algorithm Frequency domain glottal source estimation Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Estimation of the glottal flow from the speech or singing voice |
title_full |
Estimation of the glottal flow from the speech or singing voice |
title_fullStr |
Estimation of the glottal flow from the speech or singing voice |
title_full_unstemmed |
Estimation of the glottal flow from the speech or singing voice |
title_sort |
Estimation of the glottal flow from the speech or singing voice |
author |
Beleza, Hugo Miguel Ferreira |
author_facet |
Beleza, Hugo Miguel Ferreira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Mendes, Rui Ferreira, Aníbal Universidade do Minho |
dc.contributor.author.fl_str_mv |
Beleza, Hugo Miguel Ferreira |
dc.subject.por.fl_str_mv |
Impulso glótico Estimação do impulso glótico Filtragem inversa Integração no domínio das frequências Estimação do impulso glótico no domínio das frequências Glottal pulse Estimation of the glottal pulse Filter Algorithm Frequency domain glottal source estimation Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Impulso glótico Estimação do impulso glótico Filtragem inversa Integração no domínio das frequências Estimação do impulso glótico no domínio das frequências Glottal pulse Estimation of the glottal pulse Filter Algorithm Frequency domain glottal source estimation Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado em Bioinformática (área de especialização em Engenharia) |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-03-03 2016-03-03T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/47578 |
url |
http://hdl.handle.net/1822/47578 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
201601095 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132599278370816 |