Determinação da autocorrelação, HNR e NHR para análise acústica vocal

Detalhes bibliográficos
Autor(a) principal: Fernandes, Joana Filipa Teixeira
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10198/19158
Resumo: Este trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias.
id RCAP_cf331731e3600bdc6d3f8b4fbb7f4038
oai_identifier_str oai:bibliotecadigital.ipb.pt:10198/19158
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Determinação da autocorrelação, HNR e NHR para análise acústica vocalHNRJitterShimmerNHRAutocorrelaçãoMFCCsDomínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e TecnologiasEste trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias.The objective of this work was to determine the parameters: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) and autocorrelation. These parameters are used as inputs to an intelligent system for diagnosis of speech pathologies. A comparative analysis was performed between the values of the algorithm and the Praat software, in order to understand the best window and its length, in number of glottal periods. This analysis resulted in the decision to use the hanning window with a length corresponding to 6 glottal periods. By comparing the results it was concluded that this algorithm allows to extract the parameters HNR, NHR and Autocorrelation with values close enough to the reference values. An algorithm was developed to select only the part of the signal where speech occurs, eliminating the initial and final silence zones, to later extract the Mel Frequency Cepstral Coefficientes (MFCCs), Linear Prediction Coefficientes (LPC) and Line Spectral Frequency (LSF). Throughout the work it was possible, although it was not the primary objective, to complement a cured database, initiated in a previous investigation, adding more parameters and more diseases. This database now has MFCC parameters with 13 ceptral coefficients, HNR, NHR, Autocorrelation, absolute jitter, relative jitter, absolute shimmer, relative shimmer, extracted from 9 phrases corresponding to 3 vowels in 3 tones and to one sentence, for subjects with 19 pathologies, plus control subjects. This cured database provides a set of parameters on these speech signals for research on these 19 pathologies.Teixeira, João PauloBiblioteca Digital do IPBFernandes, Joana Filipa Teixeira2019-03-18T16:21:53Z201920172019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/19158TID:202196160porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-21T10:43:42Zoai:bibliotecadigital.ipb.pt:10198/19158Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:09:32.455673Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Determinação da autocorrelação, HNR e NHR para análise acústica vocal
title Determinação da autocorrelação, HNR e NHR para análise acústica vocal
spellingShingle Determinação da autocorrelação, HNR e NHR para análise acústica vocal
Fernandes, Joana Filipa Teixeira
HNR
Jitter
Shimmer
NHR
Autocorrelação
MFCCs
Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Determinação da autocorrelação, HNR e NHR para análise acústica vocal
title_full Determinação da autocorrelação, HNR e NHR para análise acústica vocal
title_fullStr Determinação da autocorrelação, HNR e NHR para análise acústica vocal
title_full_unstemmed Determinação da autocorrelação, HNR e NHR para análise acústica vocal
title_sort Determinação da autocorrelação, HNR e NHR para análise acústica vocal
author Fernandes, Joana Filipa Teixeira
author_facet Fernandes, Joana Filipa Teixeira
author_role author
dc.contributor.none.fl_str_mv Teixeira, João Paulo
Biblioteca Digital do IPB
dc.contributor.author.fl_str_mv Fernandes, Joana Filipa Teixeira
dc.subject.por.fl_str_mv HNR
Jitter
Shimmer
NHR
Autocorrelação
MFCCs
Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic HNR
Jitter
Shimmer
NHR
Autocorrelação
MFCCs
Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Este trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias.
publishDate 2017
dc.date.none.fl_str_mv 2017
2019-03-18T16:21:53Z
2019
2019-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10198/19158
TID:202196160
url http://hdl.handle.net/10198/19158
identifier_str_mv TID:202196160
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135357687562240