Speech enhancement para reconhecimento de fala

Detalhes bibliográficos
Autor(a) principal: Miguel, Gonçalo Adelino Loureiro
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/2084
Resumo: A utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar.
id RCAP_54c9a1cba9e51a14c438029ceac6b87a
oai_identifier_str oai:ria.ua.pt:10773/2084
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Speech enhancement para reconhecimento de falaEngenharia electrónicaReconhecimento automático da falaProcessamento digital de sinalRuído acústicoA utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar.The use of speech recognizers in industrial and domestic environments has significantly grown in the last years. One of the issues that we face is the presence of noise, which severely degrades performance. The main goal of this work is to develop methodologies for Speech Enhancement based on SVD, capable of addressing this issue. Our test signals are pre-processed with a Speech Enhancement block, before being received by the previously trained recognizers. We have created two user-specific speech recognizers, for two distinct scenarios: control of a wheelchair and a cinema at home. In the results presented, we have evaluated the performance of the classifiers under different conditions, such as addition of noise and application of a Speech Enhancement block, by comparing the rates of recognition, which represent the number of recognized words for a specific task to be performed.Universidade de Aveiro2011-04-19T13:52:13Z2009-01-01T00:00:00Z2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/2084porMiguel, Gonçalo Adelino Loureiroinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T10:59:16Zoai:ria.ua.pt:10773/2084Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:40:37.390290Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Speech enhancement para reconhecimento de fala
title Speech enhancement para reconhecimento de fala
spellingShingle Speech enhancement para reconhecimento de fala
Miguel, Gonçalo Adelino Loureiro
Engenharia electrónica
Reconhecimento automático da fala
Processamento digital de sinal
Ruído acústico
title_short Speech enhancement para reconhecimento de fala
title_full Speech enhancement para reconhecimento de fala
title_fullStr Speech enhancement para reconhecimento de fala
title_full_unstemmed Speech enhancement para reconhecimento de fala
title_sort Speech enhancement para reconhecimento de fala
author Miguel, Gonçalo Adelino Loureiro
author_facet Miguel, Gonçalo Adelino Loureiro
author_role author
dc.contributor.author.fl_str_mv Miguel, Gonçalo Adelino Loureiro
dc.subject.por.fl_str_mv Engenharia electrónica
Reconhecimento automático da fala
Processamento digital de sinal
Ruído acústico
topic Engenharia electrónica
Reconhecimento automático da fala
Processamento digital de sinal
Ruído acústico
description A utilização de reconhecedores de fala, em ambientes industriais e domésticos é, cada vez mais, uma constante. A presença de ruído é um dos factores com que nos debatemos, pois condiciona bastante o seu desempenho. Com a realização desta dissertação, pretende-se aplicar metodologias de Speech Enhancement baseadas em SVD, capazes de melhorar esta condicionante. Os sinais de teste são pré-processados com o bloco de Speech Enhancement, antes de serem processados pelos reconhecedores previamente treinados. Criaram-se reconhecedores de fala, dependentes do orador, para dois cenários de utilização distintos, controlo de cadeira de rodas e controlo de sala de cinema em casa. Nos resultados apresentados, o desempenho dos classificadores foi avaliado em condições diferentes, como adição de ruído e aplicação do bloco de Speech Enhancement, comparando-se percentagens de reconhecimento, que representam o número de palavras reconhecidas das tarefas a executar.
publishDate 2009
dc.date.none.fl_str_mv 2009-01-01T00:00:00Z
2009
2011-04-19T13:52:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/2084
url http://hdl.handle.net/10773/2084
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de Aveiro
publisher.none.fl_str_mv Universidade de Aveiro
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137454667595776