Speech enhancement para reconhecimento de fala
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10773/2084 |
Resumo: | A utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar. |
id |
RCAP_54c9a1cba9e51a14c438029ceac6b87a |
---|---|
oai_identifier_str |
oai:ria.ua.pt:10773/2084 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Speech enhancement para reconhecimento de falaEngenharia electrónicaReconhecimento automático da falaProcessamento digital de sinalRuído acústicoA utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar.The use of speech recognizers in industrial and domestic environments has significantly grown in the last years. One of the issues that we face is the presence of noise, which severely degrades performance. The main goal of this work is to develop methodologies for Speech Enhancement based on SVD, capable of addressing this issue. Our test signals are pre-processed with a Speech Enhancement block, before being received by the previously trained recognizers. We have created two user-specific speech recognizers, for two distinct scenarios: control of a wheelchair and a cinema at home. In the results presented, we have evaluated the performance of the classifiers under different conditions, such as addition of noise and application of a Speech Enhancement block, by comparing the rates of recognition, which represent the number of recognized words for a specific task to be performed.Universidade de Aveiro2011-04-19T13:52:13Z2009-01-01T00:00:00Z2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/2084porMiguel, Gonçalo Adelino Loureiroinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T10:59:16Zoai:ria.ua.pt:10773/2084Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:40:37.390290Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Speech enhancement para reconhecimento de fala |
title |
Speech enhancement para reconhecimento de fala |
spellingShingle |
Speech enhancement para reconhecimento de fala Miguel, Gonçalo Adelino Loureiro Engenharia electrónica Reconhecimento automático da fala Processamento digital de sinal Ruído acústico |
title_short |
Speech enhancement para reconhecimento de fala |
title_full |
Speech enhancement para reconhecimento de fala |
title_fullStr |
Speech enhancement para reconhecimento de fala |
title_full_unstemmed |
Speech enhancement para reconhecimento de fala |
title_sort |
Speech enhancement para reconhecimento de fala |
author |
Miguel, Gonçalo Adelino Loureiro |
author_facet |
Miguel, Gonçalo Adelino Loureiro |
author_role |
author |
dc.contributor.author.fl_str_mv |
Miguel, Gonçalo Adelino Loureiro |
dc.subject.por.fl_str_mv |
Engenharia electrónica Reconhecimento automático da fala Processamento digital de sinal Ruído acústico |
topic |
Engenharia electrónica Reconhecimento automático da fala Processamento digital de sinal Ruído acústico |
description |
A utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009-01-01T00:00:00Z 2009 2011-04-19T13:52:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/2084 |
url |
http://hdl.handle.net/10773/2084 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de Aveiro |
publisher.none.fl_str_mv |
Universidade de Aveiro |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137454667595776 |