Classificação automática de desordens vocais usando a variância wavelet

Detalhes bibliográficos
Autor(a) principal: Santos, Rafael Alberto dos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/30196
Resumo: Distúrbios vocais podem existir quando a voz não consegue cumprir seu papel básico de transmissão verbal e emocional. Esses distúrbios podem ser percebidos pela variação de parâmetros perceptuais da voz, tais como qualidade, tom e volume. As alterações dos parâmetros da voz podem ser medidas e classificadas de forma automática por meio da análise acústica. O presente trabalho propõe um algoritmo de classificação automática de distúrbios vocais, utilizando a variância wavelet em sinais de vogal "a" com tom neutro para formar um vetor de características. As patologias em análise são o nódulo e edema de Reinke. Essas patologias afetam as pregas vocais e alteram parâmetros acústicos dos sinais de voz. A classificação é realizada utilizando a técnica de aprendizagem supervisionada support vector machine. Os experimentos são realizados como uma classificação binária, entre os grupos Edema/Saudável, Nódulo/Saudável, Edema/Nódulo e Patológico/Saudável, sendo a classe patológica formada pelas patologias nódulo e edema de Reinke. Com o objetivo de comparar os resultados obtidos, realiza-se a extração de atributos dos sinais de voz com outros dois métodos, o mel espectrograma e os coeficientes cepstrais de frequência mel. Os resultados obtidos nos testes são promissores e indicam que as características extraídas dos sinais através da variância wavelet discriminam as classes e podem substituir as técnicas mel espectrograma e MFCC.
id UTFPR-12_8b42936be41056c3a8e3b0ff2823b27a
oai_identifier_str oai:repositorio.utfpr.edu.br:1/30196
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-11-29T14:15:01Z2022-11-29T14:15:01Z2022-07-28SANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.http://repositorio.utfpr.edu.br/jspui/handle/1/30196Distúrbios vocais podem existir quando a voz não consegue cumprir seu papel básico de transmissão verbal e emocional. Esses distúrbios podem ser percebidos pela variação de parâmetros perceptuais da voz, tais como qualidade, tom e volume. As alterações dos parâmetros da voz podem ser medidas e classificadas de forma automática por meio da análise acústica. O presente trabalho propõe um algoritmo de classificação automática de distúrbios vocais, utilizando a variância wavelet em sinais de vogal "a" com tom neutro para formar um vetor de características. As patologias em análise são o nódulo e edema de Reinke. Essas patologias afetam as pregas vocais e alteram parâmetros acústicos dos sinais de voz. A classificação é realizada utilizando a técnica de aprendizagem supervisionada support vector machine. Os experimentos são realizados como uma classificação binária, entre os grupos Edema/Saudável, Nódulo/Saudável, Edema/Nódulo e Patológico/Saudável, sendo a classe patológica formada pelas patologias nódulo e edema de Reinke. Com o objetivo de comparar os resultados obtidos, realiza-se a extração de atributos dos sinais de voz com outros dois métodos, o mel espectrograma e os coeficientes cepstrais de frequência mel. Os resultados obtidos nos testes são promissores e indicam que as características extraídas dos sinais através da variância wavelet discriminam as classes e podem substituir as técnicas mel espectrograma e MFCC.Vocal disorders may be present when the voice fails to fulfill its basic role of verbal and emotional transmission. These disturbances can be perceived by the variation of perceptual parameters of the voice, such as quality, pitch, and loudness. Changes in voice parameters can be measured and classified automatically through acoustic analysis. The present work proposes an algorithm for automatic classification of voice disorders, using wavelet variance in signals of vowel "a" with neutral pitch to form a feature vector. The pathology under analysis is nodules and Reinke's edema. These pathologies affect the vocal folds and alter acoustic parameters of voice signals. Classification is performed using a supervised learning technique called support vector machine. The experiments are performed as a binary classification between the groups Edema/Healthy, Nodule/Healthy, Edema/Nodule and Pathological/Healthy, being the pathological class formed by the pathologies nodule and Reinke's edema. In order to compare the results, the extraction of features of the voice signals is carried out with two other methods, the mel spectrogram and the mel frequency cepstral coefficients. The results obtained in the tests are promising and indicate that the features extracted from the signals using wavelet variance discriminate the classes and can replace the mel spectrogram and MFCC techniques.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioPrograma de Pós-Graduação em Engenharia ElétricaUTFPRBrasilCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEngenharia ElétricaWavelets (Matemática)Reconhecimento automático da vozClassificaçãoWavelets (Mathematics)Automatic speech recognitionClassificationClassificação automática de desordens vocais usando a variância waveletAutomatic classification of vocal disorders using wavelet varianceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCornélio ProcópioScalassara, Paulo Rogeriohttp://lattes.cnpq.br/5016119298122922Agulhari, Cristiano Marcoshttp://lattes.cnpq.br/4935395556663775Scalassara, Paulo Rogeriohttp://lattes.cnpq.br/5016119298122922Guido, Rodrigo Capobiancohttp://lattes.cnpq.br/6542086226808067Endo, Wagnerhttp://lattes.cnpq.br/5229173673499346https://orcid.org/0000-0002-8071-2264http://lattes.cnpq.br/9906630950861529Santos, Rafael Alberto dosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALclassificacaoautomaticadedesordensvocais.pdfapplication/pdf7484569http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/1/classificacaoautomaticadedesordensvocais.pdf935c31aecce9d8d68d1e9815e956299aMD51TEXTclassificacaoautomaticadedesordensvocais.pdf.txtclassificacaoautomaticadedesordensvocais.pdf.txtExtracted texttext/plain116620http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/2/classificacaoautomaticadedesordensvocais.pdf.txt03bb6a8a16ccfc53a9572d0cbef7ac98MD52THUMBNAILclassificacaoautomaticadedesordensvocais.pdf.jpgclassificacaoautomaticadedesordensvocais.pdf.jpgGenerated Thumbnailimage/jpeg1307http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/3/classificacaoautomaticadedesordensvocais.pdf.jpgc02b08ed74885d00d90a0b57e3b74ff8MD531/301962022-11-30 04:07:41.935oai:repositorio.utfpr.edu.br:1/30196Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-11-30T06:07:41Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Classificação automática de desordens vocais usando a variância wavelet
dc.title.alternative.pt_BR.fl_str_mv Automatic classification of vocal disorders using wavelet variance
title Classificação automática de desordens vocais usando a variância wavelet
spellingShingle Classificação automática de desordens vocais usando a variância wavelet
Santos, Rafael Alberto dos
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Wavelets (Matemática)
Reconhecimento automático da voz
Classificação
Wavelets (Mathematics)
Automatic speech recognition
Classification
Engenharia Elétrica
title_short Classificação automática de desordens vocais usando a variância wavelet
title_full Classificação automática de desordens vocais usando a variância wavelet
title_fullStr Classificação automática de desordens vocais usando a variância wavelet
title_full_unstemmed Classificação automática de desordens vocais usando a variância wavelet
title_sort Classificação automática de desordens vocais usando a variância wavelet
author Santos, Rafael Alberto dos
author_facet Santos, Rafael Alberto dos
author_role author
dc.contributor.advisor1.fl_str_mv Scalassara, Paulo Rogerio
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5016119298122922
dc.contributor.referee1.fl_str_mv Agulhari, Cristiano Marcos
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/4935395556663775
dc.contributor.referee2.fl_str_mv Scalassara, Paulo Rogerio
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5016119298122922
dc.contributor.referee3.fl_str_mv Guido, Rodrigo Capobianco
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/6542086226808067
dc.contributor.referee4.fl_str_mv Endo, Wagner
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/5229173673499346
dc.contributor.authorID.fl_str_mv https://orcid.org/0000-0002-8071-2264
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9906630950861529
dc.contributor.author.fl_str_mv Santos, Rafael Alberto dos
contributor_str_mv Scalassara, Paulo Rogerio
Agulhari, Cristiano Marcos
Scalassara, Paulo Rogerio
Guido, Rodrigo Capobianco
Endo, Wagner
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Wavelets (Matemática)
Reconhecimento automático da voz
Classificação
Wavelets (Mathematics)
Automatic speech recognition
Classification
Engenharia Elétrica
dc.subject.por.fl_str_mv Wavelets (Matemática)
Reconhecimento automático da voz
Classificação
Wavelets (Mathematics)
Automatic speech recognition
Classification
dc.subject.capes.pt_BR.fl_str_mv Engenharia Elétrica
description Distúrbios vocais podem existir quando a voz não consegue cumprir seu papel básico de transmissão verbal e emocional. Esses distúrbios podem ser percebidos pela variação de parâmetros perceptuais da voz, tais como qualidade, tom e volume. As alterações dos parâmetros da voz podem ser medidas e classificadas de forma automática por meio da análise acústica. O presente trabalho propõe um algoritmo de classificação automática de distúrbios vocais, utilizando a variância wavelet em sinais de vogal "a" com tom neutro para formar um vetor de características. As patologias em análise são o nódulo e edema de Reinke. Essas patologias afetam as pregas vocais e alteram parâmetros acústicos dos sinais de voz. A classificação é realizada utilizando a técnica de aprendizagem supervisionada support vector machine. Os experimentos são realizados como uma classificação binária, entre os grupos Edema/Saudável, Nódulo/Saudável, Edema/Nódulo e Patológico/Saudável, sendo a classe patológica formada pelas patologias nódulo e edema de Reinke. Com o objetivo de comparar os resultados obtidos, realiza-se a extração de atributos dos sinais de voz com outros dois métodos, o mel espectrograma e os coeficientes cepstrais de frequência mel. Os resultados obtidos nos testes são promissores e indicam que as características extraídas dos sinais através da variância wavelet discriminam as classes e podem substituir as técnicas mel espectrograma e MFCC.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-11-29T14:15:01Z
dc.date.available.fl_str_mv 2022-11-29T14:15:01Z
dc.date.issued.fl_str_mv 2022-07-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/30196
identifier_str_mv SANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30196
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/1/classificacaoautomaticadedesordensvocais.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/2/classificacaoautomaticadedesordensvocais.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30196/3/classificacaoautomaticadedesordensvocais.pdf.jpg
bitstream.checksum.fl_str_mv 935c31aecce9d8d68d1e9815e956299a
03bb6a8a16ccfc53a9572d0cbef7ac98
c02b08ed74885d00d90a0b57e3b74ff8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923046236618752