Patologias da laringe com análise acústica vocal

Detalhes bibliográficos
Autor(a) principal: Gonçalves, André Amorim
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10198/12662
Resumo: Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.
id RCAP_747e214bd53adc57501829ebed856d45
oai_identifier_str oai:bibliotecadigital.ipb.pt:10198/12662
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Patologias da laringe com análise acústica vocalFrequência fundamentalJitterShimmerHarmonic to noise ratioPatologias da laringeEste trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.This work aims to produce a robust algorithm that can correctly measure the voice parameters, Jitter, Shimmer and HNR in pathological voices for later identification of these pathologies using intelligent systems. It was also performed a comparative analysis of each of these parameters for male and female voices, or between control and pathological voices. The algorithm was developed under Matlab language, and basically consists of the detection of the cycle to cycle peaks, varying depending on the period of glottal voice signals. This identification can be relatively simple in synthesized voice, it is somewhat more complex in real voices and can be quite difficult in pathological voices where the glottal cycles may be very irregular and different from patient to patient. Jitter is the variation of the glottal cycles and can be measured in different ways like Jitt, Jitta, Rap and Ppq5 parameters. The shimmer is the amplitude variation of the successive glottal cycles and can be measured by Shim ShdB, Apq3 and Apq5 parameters. The HNR is the Harmonic to Noise Ratio. The values obtained by the Praat program for these parameters were used as a comparison with the results of the developed algorithm. The algorithm has been tested with synthesized signals with well-known values, with normal voice signals (Control) and pathological voice signals from Saarbrücken Voice Database (SVD). Using the synthesized signal the algorithm produced an error of less than 5 s for Jitta parameter and less than 0.1% for Shim. When compared with real voices (voice signals control and pathological), differences in values between the Praat and the algorithm were negligible. It has also produced a statistical comparison between control signals and signals from Laryngitis, Hyperfunctional Dysphonia, Spasmodic Dysphonia, Vocal Cord Polyps and vocal Cords Ageing pathologies. Of these only the last three have statistically distinct parameters in relation to the group of voice control signals.Teixeira, João PauloBiblioteca Digital do IPBGonçalves, André Amorim2016-01-20T12:29:20Z20152015-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/12662TID:201456222porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-21T10:29:43Zoai:bibliotecadigital.ipb.pt:10198/12662Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:02:56.217128Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Patologias da laringe com análise acústica vocal
title Patologias da laringe com análise acústica vocal
spellingShingle Patologias da laringe com análise acústica vocal
Gonçalves, André Amorim
Frequência fundamental
Jitter
Shimmer
Harmonic to noise ratio
Patologias da laringe
title_short Patologias da laringe com análise acústica vocal
title_full Patologias da laringe com análise acústica vocal
title_fullStr Patologias da laringe com análise acústica vocal
title_full_unstemmed Patologias da laringe com análise acústica vocal
title_sort Patologias da laringe com análise acústica vocal
author Gonçalves, André Amorim
author_facet Gonçalves, André Amorim
author_role author
dc.contributor.none.fl_str_mv Teixeira, João Paulo
Biblioteca Digital do IPB
dc.contributor.author.fl_str_mv Gonçalves, André Amorim
dc.subject.por.fl_str_mv Frequência fundamental
Jitter
Shimmer
Harmonic to noise ratio
Patologias da laringe
topic Frequência fundamental
Jitter
Shimmer
Harmonic to noise ratio
Patologias da laringe
description Este trabalho tem como objetivo produzir um algoritmo robusto capaz de medir corretamente os parâmetros da voz, Jitter, Shimmer e HNR, em vozes patológicas para posterior identificação destas patologias com recurso a sistemas inteligentes. Foi ainda realizada uma análise comparativa de cada um destes parâmetros para vozes masculinas e femininas, ou entre vozes de controlo e vozes patológicas. O algoritmo foi desenvolvido em linguagem do MatLab, e, basicamente consiste na deteção dos picos ciclo a ciclo, variando consoante o período glotal dos sinais de voz. Esta identificação pode ser relativamente simples em vozes sintetizadas, é um pouco mais complexa em vozes reais e pode ser bastante mais difícil em vozes patológicas em que os ciclos glotais podem ser muito irregulares, e diferentes de paciente para paciente. O Jitter consiste na variação dos ciclos glotais e pode ser medido de formas diferentes como os parâmetros Jitt, Jitta, Rap e Ppq5. O Shimmer consiste na variação da amplitude dos sucessivos ciclos glotais e pode ser medido pelos parâmetros Shim, ShdB, Apq3 e Apq5. O HNR é a relação sinal ruído. Utilizaram-se os valores obtidos pelo programa Praat para estes parâmetros como termo de comparação com os resultados do algoritmo desenvolvido. O algoritmo foi testado com sinais sintetizados, com valores bem conhecidos para os parâmetros, sinais de voz normal (Controlo) e sinais de voz patológicos provenientes da base de dados Saarbrucken Voice Database (SVD). Na comparação realizada utilizando o sinal sintetizado o algoritmo produziu um erro inferior a 5 s para o parâmetro Jitta e inferiores a 0.1% para o Shim. Quando comparado com vozes reais (sinais de vozes de controlo e patológicas), as diferenças de valores entre o Praat e o algoritmo foram pouco significativas. Foi também realizada uma comparação estatística do comportamento dos parâmetros do Jitter e do Shimmer em sinais de voz de controlo e sinais provenientes das patologias Laringite, Disfonia Hiperfuncional, Disfonia Espasmódica, Pólipos das Cordas Vocais e Envelhecimento das Cordas Vocais. Destas só as três últimas apresentaram distinção estatisticamente significativa dos parâmetros em relação ao grupo de sinais de voz de controlo.
publishDate 2015
dc.date.none.fl_str_mv 2015
2015-01-01T00:00:00Z
2016-01-20T12:29:20Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10198/12662
TID:201456222
url http://hdl.handle.net/10198/12662
identifier_str_mv TID:201456222
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135270601228288