Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿

Sousa, Livio Carvalho

Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿

Detalhes bibliográficos
Autor(a) principal:	Sousa, Livio Carvalho
Data de Publicação:	2004
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo:	https://hdl.handle.net/20.500.12733/1598391
Resumo:	Orientador: Fabio Violaro

Metadados do item

id	UNICAMP-30_8d0ac3dd86cf4fbd46e2f6461d3452ca
oai_identifier_str	oai::324107
network_acronym_str	UNICAMP-30
network_name_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿TelecomunicaçõesProcessamento de sinaisSistemas de processamento da falaReconhecimento automático da vozReconhecimento automatico da falaOrientador: Fabio ViolaroDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Neste trabalho realizou-se o estudo da técnica via "eigenvoices"[13] [16][17][18] [30] [31]para adaptação de locutor em um sistema de reconhecimento de fala contínua usando o português do Brasil. Dentre as várias técnicas utilizadas para a adaptação de locutor, incluindo as clássicas MAP ("Maximum A Posteriori'') e MLLR ("Maximum Likelihood Linear Regression''), uma nova técnica, chamada "eigenvoice technique", foi proposta por Kuhn visando tornar mais rápido o processo de adaptação de locutor para aplicação em sistemas operando em tempo real. No início, estudos se concentraram nas aplicações com palavras isoladas, mas várias pesquisas estão sendo realizadas para a análise dessa técnica em fala contínua, como é o caso deste trabalho. A característica principal da técnica de adaptação via "eigenvoices" é a representação do novo locutor como uma combinação linear de parâmetros ("eigenvoices") obtidos a partir de modelos dependente de locutor previamente treinados. Dessa forma, o novo locutor é representado como um ponto dentro do espaço cujos eixos são formados pelos "eigenvoices". O algoritmo de máxima verossimilhança MLED ("Maximum Likelihood Eigen Decomposition'') foi usado para o cálculo dos coeficientes da combinação linear para a estimação dos parâmetros do novo locutor. Após a realização de testes com número variado de locuções de adaptação e de iterações do algoritmo, foi observado que: para um bom desempenho dos modelos adaptados, 3 a 5 iterações do algoritmo são necessárias; o mais importante não é o número de locuções de adaptação mas sim o seu conteúdo fonético. Em suma, o estudo revelou que a técnica se mostrou eficiente para a aplicação, porém mais pesquisas são necessárias na áreaAbstract: In this work a research was made in order to evaluate the use of the eigenvoice technique (13) (16) (17) (18) (30) (31) to speaker adaptation on a continuous speech recognition system. Amongst the severa! speaker adaptation techniques, like the classical MAP and MLLR, a new technique, called eigenvoice technique, was proposed by Kuhn for fast speaker adaptation in real time applications. Firstly, researches were made just on isolated words applications, and nowadays they are focused on continuous speech applications, like this work. The main feature of the eigenvoice technique is the representation of the new speaker by a linear combination of parameters (eigenvoices) extracted from speaker dependent models previously trained. The new speaker is represented by a point in a space whose axis are the eigenvoices. The Maximum Likelihood Eigen Decomposition (MLED) algorithm was used to calculate the combination coefficients in order to estimate the parameters of the new speaker. After tests varying the number of adaptation sentences and algorithm iterations, it was verified that: for a good adaptation performance, 3 to 5 algorithm iterations are necessary; the number of adaptation sentences is not very important, the more important is the adaptation sentences phonetic contento In conclusion, the eigenvoice technique showed to be efficient for the application on continuous speech, however more studies must be made in the areaMestradoTelecomunicações e TelemáticaMestre em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Ynoguti, Carlos AlbertoPortugheis, JaimeMartins, José AntônioUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação não informadoUNIVERSIDADE ESTADUAL DE CAMPINASSousa, Livio Carvalho20042004-09-24T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf(Broch.)https://hdl.handle.net/20.500.12733/1598391SOUSA, Livio Carvalho. Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1598391. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/324107porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T04:01:07Zoai::324107Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T04:01:07Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
title	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
spellingShingle	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿ Sousa, Livio Carvalho Telecomunicações Processamento de sinais Sistemas de processamento da fala Reconhecimento automático da voz Reconhecimento automatico da fala
title_short	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
title_full	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
title_fullStr	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
title_full_unstemmed	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
title_sort	Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿
author	Sousa, Livio Carvalho
author_facet	Sousa, Livio Carvalho
author_role	author
dc.contributor.none.fl_str_mv	Violaro, Fábio, 1950- Ynoguti, Carlos Alberto Portugheis, Jaime Martins, José Antônio Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação não informado UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv	Sousa, Livio Carvalho
dc.subject.por.fl_str_mv	Telecomunicações Processamento de sinais Sistemas de processamento da fala Reconhecimento automático da voz Reconhecimento automatico da fala
topic	Telecomunicações Processamento de sinais Sistemas de processamento da fala Reconhecimento automático da voz Reconhecimento automatico da fala
description	Orientador: Fabio Violaro
publishDate	2004
dc.date.none.fl_str_mv	2004 2004-09-24T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	(Broch.) https://hdl.handle.net/20.500.12733/1598391 SOUSA, Livio Carvalho. Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1598391. Acesso em: 2 set. 2024.
identifier_str_mv	(Broch.) SOUSA, Livio Carvalho. Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿. 2004. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1598391. Acesso em: 2 set. 2024.
url	https://hdl.handle.net/20.500.12733/1598391
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://repositorio.unicamp.br/acervo/detalhe/324107
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	[s.n.]
publisher.none.fl_str_mv	[s.n.]
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP
instname_str	Universidade Estadual de Campinas (UNICAMP)
instacron_str	UNICAMP
institution	UNICAMP
reponame_str	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv	sbubd@unicamp.br
_version_	1809188912250224640

Adaptação de locutor em sistema de reconhecimento de fala continua empregando ¿Eigenvoices¿

Registros relacionados