Patologias da laringe com análise acústica vocal
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10198/12662 |
Resumo: | Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo. |
id |
RCAP_747e214bd53adc57501829ebed856d45 |
---|---|
oai_identifier_str |
oai:bibliotecadigital.ipb.pt:10198/12662 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Patologias da laringe com análise acústica vocalFrequência fundamentalJitterShimmerHarmonic to noise ratioPatologias da laringeEste trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.This work aims to produce a robust algorithm that can correctly measure the voice parameters, Jitter, Shimmer and HNR in pathological voices for later identification of these pathologies using intelligent systems. It was also performed a comparative analysis of each of these parameters for male and female voices, or between control and pathological voices. The algorithm was developed under Matlab language, and basically consists of the detection of the cycle to cycle peaks, varying depending on the period of glottal voice signals. This identification can be relatively simple in synthesized voice, it is somewhat more complex in real voices and can be quite difficult in pathological voices where the glottal cycles may be very irregular and different from patient to patient. Jitter is the variation of the glottal cycles and can be measured in different ways like Jitt, Jitta, Rap and Ppq5 parameters. The shimmer is the amplitude variation of the successive glottal cycles and can be measured by Shim ShdB, Apq3 and Apq5 parameters. The HNR is the Harmonic to Noise Ratio. The values obtained by the Praat program for these parameters were used as a comparison with the results of the developed algorithm. The algorithm has been tested with synthesized signals with well-known values, with normal voice signals (Control) and pathological voice signals from Saarbrücken Voice Database (SVD). Using the synthesized signal the algorithm produced an error of less than 5 s for Jitta parameter and less than 0.1% for Shim. When compared with real voices (voice signals control and pathological), differences in values between the Praat and the algorithm were negligible. It has also produced a statistical comparison between control signals and signals from Laryngitis, Hyperfunctional Dysphonia, Spasmodic Dysphonia, Vocal Cord Polyps and vocal Cords Ageing pathologies. Of these only the last three have statistically distinct parameters in relation to the group of voice control signals.Teixeira, João PauloBiblioteca Digital do IPBGonçalves, André Amorim2016-01-20T12:29:20Z20152015-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/12662TID:201456222porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-21T10:29:43Zoai:bibliotecadigital.ipb.pt:10198/12662Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:02:56.217128Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Patologias da laringe com análise acústica vocal |
title |
Patologias da laringe com análise acústica vocal |
spellingShingle |
Patologias da laringe com análise acústica vocal Gonçalves, André Amorim Frequência fundamental Jitter Shimmer Harmonic to noise ratio Patologias da laringe |
title_short |
Patologias da laringe com análise acústica vocal |
title_full |
Patologias da laringe com análise acústica vocal |
title_fullStr |
Patologias da laringe com análise acústica vocal |
title_full_unstemmed |
Patologias da laringe com análise acústica vocal |
title_sort |
Patologias da laringe com análise acústica vocal |
author |
Gonçalves, André Amorim |
author_facet |
Gonçalves, André Amorim |
author_role |
author |
dc.contributor.none.fl_str_mv |
Teixeira, João Paulo Biblioteca Digital do IPB |
dc.contributor.author.fl_str_mv |
Gonçalves, André Amorim |
dc.subject.por.fl_str_mv |
Frequência fundamental Jitter Shimmer Harmonic to noise ratio Patologias da laringe |
topic |
Frequência fundamental Jitter Shimmer Harmonic to noise ratio Patologias da laringe |
description |
Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015 2015-01-01T00:00:00Z 2016-01-20T12:29:20Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10198/12662 TID:201456222 |
url |
http://hdl.handle.net/10198/12662 |
identifier_str_mv |
TID:201456222 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135270601228288 |