Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123 |
Resumo: | Estima-se que um terço da força de trabalho humana dependa da voz para realização de seus ofícios. Procedimentos médicos avaliam a qualidade vocal do indivíduo sendo os mais usados aqueles baseados na escuta da voz (subjetivo) ou na inspeção das dobras (ou pregas) vocais por exames sofisticados (objetivos, porém invasivos e caros). A análise acústica da voz busca extrair medidas robustas para descrever vários fenômenos associados à produção da fala ou características intrínsecas do ser humano como frequência fundamental, timbre, etc. O presente estudo consiste na caracterização de um modelo de processamento digital de Voz para apoio ao diagnóstico no contexto da construção de sistemas de identificação automatizados de patologias da fala. Para análise da técnica proposta foi utilizada uma base de dados (base KAY) que foi estruturada por especialistas num arranjo de seis grupos de Patologias. A esse, acrescentado também um de vozes “Normal”. Assim, 182 vozes foram escolhidas, as quais dispunham de um catálogo indexado de cerca de 33 descritores, para cada voz, calculados da elocução da vogal \a\ sustentada. Ao selecionar combinações desses descritores – como perturbações em frequência (jitter), em amplitude (shimmer) etc, este estudo encontrou evidências estatísticas e mostrou ser possível: a) Separar vozes normais das patológicas – esperado, b) Separar patologias específicas (Paralisia, Edema de Reinke, Nódulos) com acurácia de 100% (para a grande maioria dessas combinações) e cerca de 92% (para Nódulos contra Reinke); c) Discriminá-las por meio de classificadores (redes neurais artificiais e máquina de vetores de suporte) e reduzir a dimensionalidade e complexidade (quantidade de dados) via técnica de análise de componentes principais (ACP) sobre esses descritores para a separação intra patologias; e d) Testes estatísticos com os grupos locais confirmaram também limiares de indícios de Anormalidade presentes na literatura. A utilização de menor quantidade de descritores – obtida pós ACP (compressão) – mostrou-se também eficiente (mesmas taxas de acurácia). |
id |
UFCG_7bbf58d408e31da6d1e8e56a853f8b5a |
---|---|
oai_identifier_str |
oai:localhost:riufcg/123 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte.Inteligência ArtificialProcessamento Digital de VozDiscriminação de Patologias da VozVozes PatológicasAprendizagem de MáquinaAnálise Acústica da VozDoenças da Voz e FalaVoice Acoustic AnalysesDigital Voice ProcessingHealthy and Pathological VoicesDigital Voice Signal ProcessingCiência da computação.Fonoaudiologia.Estima-se que um terço da força de trabalho humana dependa da voz para realização de seus ofícios. Procedimentos médicos avaliam a qualidade vocal do indivíduo sendo os mais usados aqueles baseados na escuta da voz (subjetivo) ou na inspeção das dobras (ou pregas) vocais por exames sofisticados (objetivos, porém invasivos e caros). A análise acústica da voz busca extrair medidas robustas para descrever vários fenômenos associados à produção da fala ou características intrínsecas do ser humano como frequência fundamental, timbre, etc. O presente estudo consiste na caracterização de um modelo de processamento digital de Voz para apoio ao diagnóstico no contexto da construção de sistemas de identificação automatizados de patologias da fala. Para análise da técnica proposta foi utilizada uma base de dados (base KAY) que foi estruturada por especialistas num arranjo de seis grupos de Patologias. A esse, acrescentado também um de vozes “Normal”. Assim, 182 vozes foram escolhidas, as quais dispunham de um catálogo indexado de cerca de 33 descritores, para cada voz, calculados da elocução da vogal \a\ sustentada. Ao selecionar combinações desses descritores – como perturbações em frequência (jitter), em amplitude (shimmer) etc, este estudo encontrou evidências estatísticas e mostrou ser possível: a) Separar vozes normais das patológicas – esperado, b) Separar patologias específicas (Paralisia, Edema de Reinke, Nódulos) com acurácia de 100% (para a grande maioria dessas combinações) e cerca de 92% (para Nódulos contra Reinke); c) Discriminá-las por meio de classificadores (redes neurais artificiais e máquina de vetores de suporte) e reduzir a dimensionalidade e complexidade (quantidade de dados) via técnica de análise de componentes principais (ACP) sobre esses descritores para a separação intra patologias; e d) Testes estatísticos com os grupos locais confirmaram também limiares de indícios de Anormalidade presentes na literatura. A utilização de menor quantidade de descritores – obtida pós ACP (compressão) – mostrou-se também eficiente (mesmas taxas de acurácia).It is estimated one-third of the work force relies on the use the voice in their jobs. The clinical diagnostic may be performed on voice listening by a specialist (subjective perspective) or through invasive and often not cheaper exams to check vocal structures. The area of Voice Acoustic analyses aims to extract robust measurements to describe several phenomena associated with voice production, or human being particular characteristics like fundamental frequency, timbre, etc. This study consisted of a model characterizing the digital voice processing for support in building automatic systems for the identification of disorders of speech (to aid diagnosis of pathologies). To support this investigation and proposed model, a commercial voice database (KAY base) was used with the endorsement from medical specialists. Derived acoustic analyses of those speech samples data records were presented to professionals for classification and six “severities groups” case-studied were built. After these analyses, one Normal group was added and, at the end, 182 voices have been selected. Their refined audio database contain, among other things, an indexed list of vocal descriptors calculated on the presence of the utterance of the vowel \a\ sustained speech. Statistical evidences were found: a) Difference between pathological groups vocal descriptors to normal (expected); b) It was achieved 100% from true positive, most cases, among Paralysis, Reinke's Edema and Nodules separations; c) from few cases, there were detected minor distinctions: Paralysis, Reinke's Edema, Nodules and Edema (pair comparison) with disordered groups; c) Among Machine Learning Algorithms (artificial neural networks "RN" and support vector machine "SVM"), the technique of Principal Components Analyses (PCA) and main statistics performed, it was found facts to help to structure some automated recognition systems. These Supervised learning methods showed that it could be possible to generate classification predictions (disordered presence) for the response to new data; and d) Inner tests also confirmed literature established reference thresholds. Hence considering suitable combinations of descriptors with two machine learning classifiers, as showed, is sufficient suitable and worthy.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGMELCHER, Elmar Uwe Kurt.ARAÚJO, Joseana Macêdo Fechini Regis de.COSTA, Silvana Luciene do Nascimento Cunha.GOMES, Herman Martins.ESPINOLA, Sérgio de Brito.2014-03-122017-09-19T15:36:01Z2017-09-182017-09-19T15:36:01Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123ESPINOLA, Sérgio de Brito. Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. Dissertação de Mestrado. 183f. Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande. Campina Grande, Paraíba, Brasil, 2014. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123porBolsa de estudos fornecida pela empresa HP.info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-23T10:47:35Zoai:localhost:riufcg/123Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-23T10:47:35Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
title |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
spellingShingle |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. ESPINOLA, Sérgio de Brito. Inteligência Artificial Processamento Digital de Voz Discriminação de Patologias da Voz Vozes Patológicas Aprendizagem de Máquina Análise Acústica da Voz Doenças da Voz e Fala Voice Acoustic Analyses Digital Voice Processing Healthy and Pathological Voices Digital Voice Signal Processing Ciência da computação. Fonoaudiologia. |
title_short |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
title_full |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
title_fullStr |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
title_full_unstemmed |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
title_sort |
Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. |
author |
ESPINOLA, Sérgio de Brito. |
author_facet |
ESPINOLA, Sérgio de Brito. |
author_role |
author |
dc.contributor.none.fl_str_mv |
MELCHER, Elmar Uwe Kurt. ARAÚJO, Joseana Macêdo Fechini Regis de. COSTA, Silvana Luciene do Nascimento Cunha. GOMES, Herman Martins. |
dc.contributor.author.fl_str_mv |
ESPINOLA, Sérgio de Brito. |
dc.subject.por.fl_str_mv |
Inteligência Artificial Processamento Digital de Voz Discriminação de Patologias da Voz Vozes Patológicas Aprendizagem de Máquina Análise Acústica da Voz Doenças da Voz e Fala Voice Acoustic Analyses Digital Voice Processing Healthy and Pathological Voices Digital Voice Signal Processing Ciência da computação. Fonoaudiologia. |
topic |
Inteligência Artificial Processamento Digital de Voz Discriminação de Patologias da Voz Vozes Patológicas Aprendizagem de Máquina Análise Acústica da Voz Doenças da Voz e Fala Voice Acoustic Analyses Digital Voice Processing Healthy and Pathological Voices Digital Voice Signal Processing Ciência da computação. Fonoaudiologia. |
description |
Estima-se que um terço da força de trabalho humana dependa da voz para realização de seus ofícios. Procedimentos médicos avaliam a qualidade vocal do indivíduo sendo os mais usados aqueles baseados na escuta da voz (subjetivo) ou na inspeção das dobras (ou pregas) vocais por exames sofisticados (objetivos, porém invasivos e caros). A análise acústica da voz busca extrair medidas robustas para descrever vários fenômenos associados à produção da fala ou características intrínsecas do ser humano como frequência fundamental, timbre, etc. O presente estudo consiste na caracterização de um modelo de processamento digital de Voz para apoio ao diagnóstico no contexto da construção de sistemas de identificação automatizados de patologias da fala. Para análise da técnica proposta foi utilizada uma base de dados (base KAY) que foi estruturada por especialistas num arranjo de seis grupos de Patologias. A esse, acrescentado também um de vozes “Normal”. Assim, 182 vozes foram escolhidas, as quais dispunham de um catálogo indexado de cerca de 33 descritores, para cada voz, calculados da elocução da vogal \a\ sustentada. Ao selecionar combinações desses descritores – como perturbações em frequência (jitter), em amplitude (shimmer) etc, este estudo encontrou evidências estatísticas e mostrou ser possível: a) Separar vozes normais das patológicas – esperado, b) Separar patologias específicas (Paralisia, Edema de Reinke, Nódulos) com acurácia de 100% (para a grande maioria dessas combinações) e cerca de 92% (para Nódulos contra Reinke); c) Discriminá-las por meio de classificadores (redes neurais artificiais e máquina de vetores de suporte) e reduzir a dimensionalidade e complexidade (quantidade de dados) via técnica de análise de componentes principais (ACP) sobre esses descritores para a separação intra patologias; e d) Testes estatísticos com os grupos locais confirmaram também limiares de indícios de Anormalidade presentes na literatura. A utilização de menor quantidade de descritores – obtida pós ACP (compressão) – mostrou-se também eficiente (mesmas taxas de acurácia). |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-03-12 2017-09-19T15:36:01Z 2017-09-18 2017-09-19T15:36:01Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123 ESPINOLA, Sérgio de Brito. Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. Dissertação de Mestrado. 183f. Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande. Campina Grande, Paraíba, Brasil, 2014. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123 |
identifier_str_mv |
ESPINOLA, Sérgio de Brito. Análise acústica para classificação de patologias da voz empregando análise de componentes principais, redes neurais artificiais e máquina de vetores de suporte. Dissertação de Mestrado. 183f. Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande. Campina Grande, Paraíba, Brasil, 2014. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/123 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Bolsa de estudos fornecida pela empresa HP. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744347666579456 |