MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS

Detalhes bibliográficos
Autor(a) principal: JOSUE VALENTIN USCATA BARRIENTOS
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
Resumo: O objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.
id PUC_RIO-1_dd2575d37ba2271c21150bfe07193152
oai_identifier_str oai:MAXWELL.puc-rio.br:37984
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str 534
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS STOCHASTIC VOICE MODELING AND CLASSIFICATION OF THE OBTAINED SIGNAL USING ARTIFICIAL NEURAL NETWORKS 2010-11-30RUBENS SAMPAIO FILHO09089683704lattes.cnpq.br/2516946694670146EDSON LUIZ CATALDO FERREIRATHIAGO GAMBOA RITTOFERNANDO ALVES ROCHINHAFERNANDO ALVES ROCHINHARUBENS SAMPAIO FILHOHANS INGO WEBERJOSUE VALENTIN USCATA BARRIENTOSPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM ENGENHARIA MECÂNICAPUC-RioBRO objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.The aim of this thesis is to classify voice signals, using neural networks, obtained through a mechanical stochastic model for voice production, this model was built from a nonparametric probabilistic approach to take into account modeling uncertainties. At first, an artificial neural network was constructed to classify real voice signals, normal and produced by subjects with pathologies on the vocal folds. As inputs for the neural network were used acoustic measures extracted from the glottal signals, obtained by inverse filtering of the real voice signals. This neural network was used, later, to classify synthesized voice signal generated by a stochastic model of the voice production, in the particular case of vowels generation. The stochastic model was constructed from the corresponding deterministic model created by Ishizaka and Flanagan, in 1972. Modeling uncertainties were taken into account through a nonparametric probabilistic approach such that random matrices were associated to mass, stiffness and damping model matrices. Probability density functions were constructed for these matrices using the Maximum Entropy Principle. The Monte Carlo Method was used to generate realizations of the voice signals. The voice signals obtained were then classified using the neural network previously constructed. From the realizations obtained, some voice signals were classified as normal, but others were classified as produced by subjects with pathologies on the vocal folds. The signal with pathologies characteristics were classified into three groups: nodulus, unilateral paralysis and other pathologies.PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROCONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E TECNOLÓGICOhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:49:56Zoai:MAXWELL.puc-rio.br:37984Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-05-13T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.pt.fl_str_mv MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
dc.title.alternative.en.fl_str_mv STOCHASTIC VOICE MODELING AND CLASSIFICATION OF THE OBTAINED SIGNAL USING ARTIFICIAL NEURAL NETWORKS
title MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
spellingShingle MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
JOSUE VALENTIN USCATA BARRIENTOS
title_short MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_full MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_fullStr MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_full_unstemmed MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_sort MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
dc.creator.ID.none.fl_str_mv
dc.creator.Lattes.none.fl_str_mv
author JOSUE VALENTIN USCATA BARRIENTOS
author_facet JOSUE VALENTIN USCATA BARRIENTOS
author_role author
dc.contributor.advisor-co1ID.none.fl_str_mv
dc.contributor.advisor-co1Lattes.none.fl_str_mv
dc.contributor.advisor1.fl_str_mv RUBENS SAMPAIO FILHO
dc.contributor.advisor1ID.fl_str_mv 09089683704
dc.contributor.advisor1Lattes.fl_str_mv lattes.cnpq.br/2516946694670146
dc.contributor.advisor-co1.fl_str_mv EDSON LUIZ CATALDO FERREIRA
dc.contributor.referee1.fl_str_mv THIAGO GAMBOA RITTO
dc.contributor.referee2.fl_str_mv FERNANDO ALVES ROCHINHA
dc.contributor.referee3.fl_str_mv FERNANDO ALVES ROCHINHA
dc.contributor.referee4.fl_str_mv RUBENS SAMPAIO FILHO
dc.contributor.referee5.fl_str_mv HANS INGO WEBER
dc.contributor.author.fl_str_mv JOSUE VALENTIN USCATA BARRIENTOS
contributor_str_mv RUBENS SAMPAIO FILHO
EDSON LUIZ CATALDO FERREIRA
THIAGO GAMBOA RITTO
FERNANDO ALVES ROCHINHA
FERNANDO ALVES ROCHINHA
RUBENS SAMPAIO FILHO
HANS INGO WEBER
description O objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.
publishDate 2010
dc.date.issued.fl_str_mv 2010-11-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.publisher.program.fl_str_mv PPG EM ENGENHARIA MECÂNICA
dc.publisher.initials.fl_str_mv PUC-Rio
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1748324945451024384