MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS

JOSUE VALENTIN USCATA BARRIENTOS

MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS

Detalhes bibliográficos
Autor(a) principal:	JOSUE VALENTIN USCATA BARRIENTOS
Data de Publicação:	2010
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da PUC-RIO (Projeto Maxwell)
Texto Completo:	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
Resumo:	O objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.

Metadados do item

id	PUC_RIO-1_dd2575d37ba2271c21150bfe07193152
oai_identifier_str	oai:MAXWELL.puc-rio.br:37984
network_acronym_str	PUC_RIO-1
network_name_str	Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str	534
spelling	info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS STOCHASTIC VOICE MODELING AND CLASSIFICATION OF THE OBTAINED SIGNAL USING ARTIFICIAL NEURAL NETWORKS 2010-11-30RUBENS SAMPAIO FILHO09089683704lattes.cnpq.br/2516946694670146EDSON LUIZ CATALDO FERREIRATHIAGO GAMBOA RITTOFERNANDO ALVES ROCHINHAFERNANDO ALVES ROCHINHARUBENS SAMPAIO FILHOHANS INGO WEBERJOSUE VALENTIN USCATA BARRIENTOSPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM ENGENHARIA MECÂNICAPUC-RioBRO objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.The aim of this thesis is to classify voice signals, using neural networks, obtained through a mechanical stochastic model for voice production, this model was built from a nonparametric probabilistic approach to take into account modeling uncertainties. At first, an artificial neural network was constructed to classify real voice signals, normal and produced by subjects with pathologies on the vocal folds. As inputs for the neural network were used acoustic measures extracted from the glottal signals, obtained by inverse filtering of the real voice signals. This neural network was used, later, to classify synthesized voice signal generated by a stochastic model of the voice production, in the particular case of vowels generation. The stochastic model was constructed from the corresponding deterministic model created by Ishizaka and Flanagan, in 1972. Modeling uncertainties were taken into account through a nonparametric probabilistic approach such that random matrices were associated to mass, stiffness and damping model matrices. Probability density functions were constructed for these matrices using the Maximum Entropy Principle. The Monte Carlo Method was used to generate realizations of the voice signals. The voice signals obtained were then classified using the neural network previously constructed. From the realizations obtained, some voice signals were classified as normal, but others were classified as produced by subjects with pathologies on the vocal folds. The signal with pathologies characteristics were classified into three groups: nodulus, unilateral paralysis and other pathologies.PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROCONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E TECNOLÓGICOhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2porreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2022-11-01T13:49:56Zoai:MAXWELL.puc-rio.br:37984Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342019-05-13T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.pt.fl_str_mv	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
dc.title.alternative.en.fl_str_mv	STOCHASTIC VOICE MODELING AND CLASSIFICATION OF THE OBTAINED SIGNAL USING ARTIFICIAL NEURAL NETWORKS
title	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
spellingShingle	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS JOSUE VALENTIN USCATA BARRIENTOS
title_short	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_full	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_fullStr	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_full_unstemmed	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
title_sort	MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS
dc.creator.ID.none.fl_str_mv
dc.creator.Lattes.none.fl_str_mv
author	JOSUE VALENTIN USCATA BARRIENTOS
author_facet	JOSUE VALENTIN USCATA BARRIENTOS
author_role	author
dc.contributor.advisor-co1ID.none.fl_str_mv
dc.contributor.advisor-co1Lattes.none.fl_str_mv
dc.contributor.advisor1.fl_str_mv	RUBENS SAMPAIO FILHO
dc.contributor.advisor1ID.fl_str_mv	09089683704
dc.contributor.advisor1Lattes.fl_str_mv	lattes.cnpq.br/2516946694670146
dc.contributor.advisor-co1.fl_str_mv	EDSON LUIZ CATALDO FERREIRA
dc.contributor.referee1.fl_str_mv	THIAGO GAMBOA RITTO
dc.contributor.referee2.fl_str_mv	FERNANDO ALVES ROCHINHA
dc.contributor.referee3.fl_str_mv	FERNANDO ALVES ROCHINHA
dc.contributor.referee4.fl_str_mv	RUBENS SAMPAIO FILHO
dc.contributor.referee5.fl_str_mv	HANS INGO WEBER
dc.contributor.author.fl_str_mv	JOSUE VALENTIN USCATA BARRIENTOS
contributor_str_mv	RUBENS SAMPAIO FILHO EDSON LUIZ CATALDO FERREIRA THIAGO GAMBOA RITTO FERNANDO ALVES ROCHINHA FERNANDO ALVES ROCHINHA RUBENS SAMPAIO FILHO HANS INGO WEBER
description	O objetivo desta dissertação é classificar sinais de vozes, usando redes neurais, obtidos por meio de um modelo mecânico-estocástico para produção da voz humana, esse modelo foi construído a partir de uma abordagem probabilística não-paramétrica para considerar incertezas do modelo. Primeiro, uma rede neural artificial foi construída para classificar sinais de vozes reais, normais e provenientes de sujeitos com patologias nas cordas vocais. Como entradas da rede neural foram usadas medidas acústicas extraídas dos sinais glotais, obtidos por filtragem inversa dos sinais de vozes reais. Essa rede neural foi usada, posteriormente, para classificar sinais de vozes sintetizadas geradas por um modelo estocástico da produção da voz humana, no caso particular da geração de vogais. O modelo estocástico da produção da voz humana foi construído tomando por base o modelo determinístico criado por Ishizaka e Flanagan. Incertezas do modelo foram consideradas através de uma abordagem probabilística não-paramétrica de modo que matrizes aleatórias foram associadas às matrizes de massa, rigidez e amortecimento do modelo. Funções densidade de probabilidade foram construídas para essas matrizes, usando o Princípio da Máxima Entropia. O método de Monte Carlo foi usado para gerar realizaçoes de sinais de vozes. Os sinais obtidos foram então classificados usando a rede neural construída previamente. Das realizações obtidas, alguns sinais de vozes foram classificados como normais, porém outros foram classificados como provenientes de sujeitos com patologias nas cordas vocais. Os sinais com características de patologia foram classificados em três grupos: nódulo, paralisia unilateral e outras patologias.
publishDate	2010
dc.date.issued.fl_str_mv	2010-11-30
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
url	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=37984@2
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.publisher.program.fl_str_mv	PPG EM ENGENHARIA MECÂNICA
dc.publisher.initials.fl_str_mv	PUC-Rio
dc.publisher.country.fl_str_mv	BR
publisher.none.fl_str_mv	PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
dc.source.none.fl_str_mv	reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO
instname_str	Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str	PUC_RIO
institution	PUC_RIO
reponame_str	Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection	Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv	Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_	1748324945451024384

MODELAGEM ESTOCÁSTICA DE VOZ E CLASSIFICAÇÃO DOS SINAIS OBTIDOS USANDO REDES NEURAIS ARTIFICIAIS

Registros relacionados