Determinação da autocorrelação, HNR e NHR para análise acústica vocal
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10198/19158 |
Resumo: | Este trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias. |
id |
RCAP_cf331731e3600bdc6d3f8b4fbb7f4038 |
---|---|
oai_identifier_str |
oai:bibliotecadigital.ipb.pt:10198/19158 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Determinação da autocorrelação, HNR e NHR para análise acústica vocalHNRJitterShimmerNHRAutocorrelaçãoMFCCsDomínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e TecnologiasEste trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias.The objective of this work was to determine the parameters: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) and autocorrelation. These parameters are used as inputs to an intelligent system for diagnosis of speech pathologies. A comparative analysis was performed between the values of the algorithm and the Praat software, in order to understand the best window and its length, in number of glottal periods. This analysis resulted in the decision to use the hanning window with a length corresponding to 6 glottal periods. By comparing the results it was concluded that this algorithm allows to extract the parameters HNR, NHR and Autocorrelation with values close enough to the reference values. An algorithm was developed to select only the part of the signal where speech occurs, eliminating the initial and final silence zones, to later extract the Mel Frequency Cepstral Coefficientes (MFCCs), Linear Prediction Coefficientes (LPC) and Line Spectral Frequency (LSF). Throughout the work it was possible, although it was not the primary objective, to complement a cured database, initiated in a previous investigation, adding more parameters and more diseases. This database now has MFCC parameters with 13 ceptral coefficients, HNR, NHR, Autocorrelation, absolute jitter, relative jitter, absolute shimmer, relative shimmer, extracted from 9 phrases corresponding to 3 vowels in 3 tones and to one sentence, for subjects with 19 pathologies, plus control subjects. This cured database provides a set of parameters on these speech signals for research on these 19 pathologies.Teixeira, João PauloBiblioteca Digital do IPBFernandes, Joana Filipa Teixeira2019-03-18T16:21:53Z201920172019-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/19158TID:202196160porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-21T10:43:42Zoai:bibliotecadigital.ipb.pt:10198/19158Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:09:32.455673Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
title |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
spellingShingle |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal Fernandes, Joana Filipa Teixeira HNR Jitter Shimmer NHR Autocorrelação MFCCs Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
title_full |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
title_fullStr |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
title_full_unstemmed |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
title_sort |
Determinação da autocorrelação, HNR e NHR para análise acústica vocal |
author |
Fernandes, Joana Filipa Teixeira |
author_facet |
Fernandes, Joana Filipa Teixeira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Teixeira, João Paulo Biblioteca Digital do IPB |
dc.contributor.author.fl_str_mv |
Fernandes, Joana Filipa Teixeira |
dc.subject.por.fl_str_mv |
HNR Jitter Shimmer NHR Autocorrelação MFCCs Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
HNR Jitter Shimmer NHR Autocorrelação MFCCs Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Este trabalho teve como objetivo a determinação dos parâmetros: Harmonic to Noise Ration (HNR), Noise to Harmonic Ratio (NHR) e Autocorrelação. Estes parâmetros são usados como entradas de um sistema inteligente para diagnóstico de patologias da fala. Foi realizada uma análise comparativa entre os valores do algoritmo e do software Praat, de modo a perceber qual a melhor janela e o seu comprimento, em número de períodos glotais. Desta análise resultou a decisão de se usar a janela de hanning com um comprimento correspondente a 6 períodos glotais. Através da comparação dos resultados chegou-se à conclusão que este algoritmo permite extrair os parâmetros HNR, NHR e Autocorrelação com valores suficientemente próximos dos valores de referência. Foi ainda desenvolvido um algoritmo para selecionar apenas a parte do sinal onde ocorre fala, eliminando as zonas de silêncio iniciais e finais, para, posteriormente, se extrair os Mel Frequency Cepstral Coefficientes (MFCCs), os Linear Prediction Coefficientes (LPC) e os Line Spectral Frequency (LSF). Ao longo do trabalho foi possível, embora não fosse o objetivo primordial, complementar uma base de dados curada, iniciada numa investigação anteriormente realizada, adicionando mais parâmetros e mais doenças. Esta base de dados ficou agora com os parâmetros MFCC com 13 coeficientes cepstrais, HNR, NHR, Autocorrelação, jitter absoluto, jitter relativo, shimmer absoluto, shimmer relativo, extraídos de 9 locuções correspondentes a 3 vogais em 3 tons e a uma frase, para sujeitos com 19 patologias, mais os sujeitos de controlo. Esta base de dados curada disponibiliza um conjunto de parâmetros sobre estes sinais de fala para a investigação sobre estas 19 patologias. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017 2019-03-18T16:21:53Z 2019 2019-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10198/19158 TID:202196160 |
url |
http://hdl.handle.net/10198/19158 |
identifier_str_mv |
TID:202196160 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135357687562240 |