Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2002 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/ |
Resumo: | O presente trabalho apresenta um modelo para um sistema de Reconhecimento Automático do Locutor (RAL) utilizando Redes Neurais Artificiais (RNA) com o objetivo de diferenciar a voz de um determinado locutor da voz de todos os demais locutores da base. Os resultados incluem subconjuntos de locutores cujas vozes foram treinadas e cujas vozes não foram treinadas pelas redes. O sistema desenvolvido conta com um módulo de classificação composto por múltiplas redes neurais que permitem a fragmentação do conjunto de treinamento, o que garante a rápida introdução de novos locutores para serem treinados sem necessidade de descartar o treinamento já feito. Além disto o módulo de decisão pode ser ajustado de acordo com o nível de segurança requerido para a aplicação do sistema de reconhecimento. A robustez do reconhecedor é aferida através de testes realizados com as amostras submetidas a diversos tipos de ruído com diferentes densidades espectrais de potência. Finalmente estudou-se a possibilidade de introdução de um módulo de melhoramento com objetivo de aumentar a relação sinal ruído antes da entrada do módulo de classificação. |
id |
USP_34d0dc9e5ddd206e71fd194382f97390 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-24092024-095946 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído.Untitled in englishNeural networksReconhecimento de vozRedes neuraisSpeech recognitionO presente trabalho apresenta um modelo para um sistema de Reconhecimento Automático do Locutor (RAL) utilizando Redes Neurais Artificiais (RNA) com o objetivo de diferenciar a voz de um determinado locutor da voz de todos os demais locutores da base. Os resultados incluem subconjuntos de locutores cujas vozes foram treinadas e cujas vozes não foram treinadas pelas redes. O sistema desenvolvido conta com um módulo de classificação composto por múltiplas redes neurais que permitem a fragmentação do conjunto de treinamento, o que garante a rápida introdução de novos locutores para serem treinados sem necessidade de descartar o treinamento já feito. Além disto o módulo de decisão pode ser ajustado de acordo com o nível de segurança requerido para a aplicação do sistema de reconhecimento. A robustez do reconhecedor é aferida através de testes realizados com as amostras submetidas a diversos tipos de ruído com diferentes densidades espectrais de potência. Finalmente estudou-se a possibilidade de introdução de um módulo de melhoramento com objetivo de aumentar a relação sinal ruído antes da entrada do módulo de classificação.This dissertation deals with the problem of automatic speaker recognition using artificial neural networks. The classifier of the recognition system has been developed in such a way that multiple artificial neural networks allow the segmentation of the training set. This procedure allows a practical introduction of new speakers in the training set without discarding the former network parameters from the previous training. Also, the decision module can be adjusted according to the established security level for the recognition system. The robustness of the recognizer has been evaluated using samples corrupted with several kinds of noise with different power spectral densities. Finally an enhancement technique has been studied aiming the increase of the signal to noise ratio in the classifier input.Biblioteca Digitais de Teses e Dissertações da USPCabral Junior, Euvaldo FerreiraMorgado, Rodrigo Dias2002-09-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-09-24T13:03:02Zoai:teses.usp.br:tde-24092024-095946Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-09-24T13:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. Untitled in english |
title |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
spellingShingle |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. Morgado, Rodrigo Dias Neural networks Reconhecimento de voz Redes neurais Speech recognition |
title_short |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
title_full |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
title_fullStr |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
title_full_unstemmed |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
title_sort |
Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído. |
author |
Morgado, Rodrigo Dias |
author_facet |
Morgado, Rodrigo Dias |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cabral Junior, Euvaldo Ferreira |
dc.contributor.author.fl_str_mv |
Morgado, Rodrigo Dias |
dc.subject.por.fl_str_mv |
Neural networks Reconhecimento de voz Redes neurais Speech recognition |
topic |
Neural networks Reconhecimento de voz Redes neurais Speech recognition |
description |
O presente trabalho apresenta um modelo para um sistema de Reconhecimento Automático do Locutor (RAL) utilizando Redes Neurais Artificiais (RNA) com o objetivo de diferenciar a voz de um determinado locutor da voz de todos os demais locutores da base. Os resultados incluem subconjuntos de locutores cujas vozes foram treinadas e cujas vozes não foram treinadas pelas redes. O sistema desenvolvido conta com um módulo de classificação composto por múltiplas redes neurais que permitem a fragmentação do conjunto de treinamento, o que garante a rápida introdução de novos locutores para serem treinados sem necessidade de descartar o treinamento já feito. Além disto o módulo de decisão pode ser ajustado de acordo com o nível de segurança requerido para a aplicação do sistema de reconhecimento. A robustez do reconhecedor é aferida através de testes realizados com as amostras submetidas a diversos tipos de ruído com diferentes densidades espectrais de potência. Finalmente estudou-se a possibilidade de introdução de um módulo de melhoramento com objetivo de aumentar a relação sinal ruído antes da entrada do módulo de classificação. |
publishDate |
2002 |
dc.date.none.fl_str_mv |
2002-09-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256533503574016 |