Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão

Bresolin, Adriano de Andrade

Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão

Detalhes bibliográficos
Autor(a) principal:	Bresolin, Adriano de Andrade
Data de Publicação:	2008
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Repositório Institucional da UFRN
Texto Completo:	https://repositorio.ufrn.br/jspui/handle/123456789/15124
Resumo:	The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literature

Metadados do item

id	UFRN_b250c87170f87ee3b4d8279fc6e3eaad
oai_identifier_str	oai:https://repositorio.ufrn.br:123456789/15124
network_acronym_str	UFRN
network_name_str	Repositório Institucional da UFRN
repository_id_str
spelling	Bresolin, Adriano de Andradehttp://lattes.cnpq.br/8862209760730631http://lattes.cnpq.br/1987295209521433Alsina, Pablo Javierhttp://lattes.cnpq.br/3653597363789712Seixas, José Manoel dehttp://lattes.cnpq.br/1404632471755241Fechine, Joseana Macêdohttp://lattes.cnpq.br/7179691582151907Dória Neto, Adrião Duarte2014-12-17T14:54:51Z2009-02-202014-12-17T14:54:51Z2008-12-02BRESOLIN, Adriano de Andrade. Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão. 2008. 100 f. Tese (Doutorado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2008.https://repositorio.ufrn.br/jspui/handle/123456789/15124The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literatureO reconhecimento automático da voz por máquinas inteligentes tem sido a meta de muitos pesquisadores nas últimas cinco décadas. Neste período, inúmeros avanços foram alcançados, como por exemplo no campo de reconhecimento de palavras isoladas (comandos), o qual atualmente apresenta taxas de reconhecimento muito altas. No entanto, ainda se está longe de desenvolver um sistema que possa ter um desempenho parecido com o ser humano, ou seja, reconhecimento automático de voz em modo contínuo. Um dos grandes desafios das pesquisas de reconhecimento de voz contínuo é a grande quantidade de padrões existentes, pois as linguagens modernas tais como: Inglês, Francês, Espanhol e Português possuem aproximadamente 500.000 palavras ou padrões a serem identificados. A proposta deste trabalho é utilizar unidades menores do que a palavra tais como: fonemas, difones e sílabas como unidades base para o reconhecimento da voz, visando o reconhecimento quaisquer palavras sem necessariamente utilizá-las. O objetivo principal deste trabalho é reduzir a restrição imposta pela quantidade excessiva de padrões existentes, ou seja, a quantidade excessiva de palavras. Com o objetivo de validar esta proposta, o sistema foi desenvolvido e testado para o reconhecimento de palavras isoladas no modo dependente do locutor. O sistema apresentado neste trabalho foi desenvolvido com uma lógica de reconhecimento hierárquica baseada nas características de produção dos fonemas da língua Portuguesa do Brasil. Estas decisões são feitas através da utilização de redes neurais do tipo Máquinas de Vetor de Suporte agrupadas na forma de Máquinas de Cômite. Os principais descritores do sinal de voz utilizados, foram obtidos através da Transformada Wavelet Packet. Os descritores MFCC (Mel-Frequency Cepstral Coefficient) também são utilizados neste trabalho. Pode-se concluir que o método proposto apresentou bons resultados nas etapas de reconhecimento de vogais, consoantes (sílabas) e palavras se comparado com outros métodos existentes na literaturaapplication/pdfporUniversidade Federal do Rio Grande do NortePrograma de Pós-Graduação em Engenharia ElétricaUFRNBRAutomação e Sistemas; Engenharia de Computação; TelecomunicaçõesReconhecimento de VozWavelet Packet e Máquinas de Vetor de SuporteSpeech RecognitionWavelet Packet and Support Vector MachineCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAReconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAdrianoAB.pdfapplication/pdf2240966https://repositorio.ufrn.br/bitstream/123456789/15124/1/AdrianoAB.pdfd9e93de6b9ef6f0023ed591b4d760ff9MD51TEXTAdrianoAB.pdf.txtAdrianoAB.pdf.txtExtracted texttext/plain206936https://repositorio.ufrn.br/bitstream/123456789/15124/6/AdrianoAB.pdf.txtefd7a6ce4b01db1ea92ac2a4b4e3de8aMD56THUMBNAILAdrianoAB.pdf.jpgAdrianoAB.pdf.jpgIM Thumbnailimage/jpeg4674https://repositorio.ufrn.br/bitstream/123456789/15124/7/AdrianoAB.pdf.jpg2a881de656d179a5b90fe353ce985b98MD57123456789/151242017-11-02 05:10:15.54oai:https://repositorio.ufrn.br:123456789/15124Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2017-11-02T08:10:15Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.por.fl_str_mv	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
title	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
spellingShingle	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão Bresolin, Adriano de Andrade Reconhecimento de Voz Wavelet Packet e Máquinas de Vetor de Suporte Speech Recognition Wavelet Packet and Support Vector Machine CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
title_full	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
title_fullStr	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
title_full_unstemmed	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
title_sort	Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
author	Bresolin, Adriano de Andrade
author_facet	Bresolin, Adriano de Andrade
author_role	author
dc.contributor.authorID.por.fl_str_mv
dc.contributor.authorLattes.por.fl_str_mv	http://lattes.cnpq.br/8862209760730631
dc.contributor.advisorID.por.fl_str_mv
dc.contributor.advisorLattes.por.fl_str_mv	http://lattes.cnpq.br/1987295209521433
dc.contributor.advisor-co1ID.por.fl_str_mv
dc.contributor.referees1.pt_BR.fl_str_mv	Seixas, José Manoel de
dc.contributor.referees1ID.por.fl_str_mv
dc.contributor.referees1Lattes.por.fl_str_mv	http://lattes.cnpq.br/1404632471755241
dc.contributor.referees2.pt_BR.fl_str_mv	Fechine, Joseana Macêdo
dc.contributor.referees2ID.por.fl_str_mv
dc.contributor.referees2Lattes.por.fl_str_mv	http://lattes.cnpq.br/7179691582151907
dc.contributor.author.fl_str_mv	Bresolin, Adriano de Andrade
dc.contributor.advisor-co1.fl_str_mv	Alsina, Pablo Javier
dc.contributor.advisor-co1Lattes.fl_str_mv	http://lattes.cnpq.br/3653597363789712
dc.contributor.advisor1.fl_str_mv	Dória Neto, Adrião Duarte
contributor_str_mv	Alsina, Pablo Javier Dória Neto, Adrião Duarte
dc.subject.por.fl_str_mv	Reconhecimento de Voz Wavelet Packet e Máquinas de Vetor de Suporte
topic	Reconhecimento de Voz Wavelet Packet e Máquinas de Vetor de Suporte Speech Recognition Wavelet Packet and Support Vector Machine CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.eng.fl_str_mv	Speech Recognition Wavelet Packet and Support Vector Machine
dc.subject.cnpq.fl_str_mv	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description	The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literature
publishDate	2008
dc.date.issued.fl_str_mv	2008-12-02
dc.date.available.fl_str_mv	2009-02-20 2014-12-17T14:54:51Z
dc.date.accessioned.fl_str_mv	2014-12-17T14:54:51Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	BRESOLIN, Adriano de Andrade. Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão. 2008. 100 f. Tese (Doutorado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2008.
dc.identifier.uri.fl_str_mv	https://repositorio.ufrn.br/jspui/handle/123456789/15124
identifier_str_mv	BRESOLIN, Adriano de Andrade. Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão. 2008. 100 f. Tese (Doutorado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2008.
url	https://repositorio.ufrn.br/jspui/handle/123456789/15124
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv	UFRN
dc.publisher.country.fl_str_mv	BR
dc.publisher.department.fl_str_mv	Automação e Sistemas; Engenharia de Computação; Telecomunicações
publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN
instname_str	Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str	UFRN
institution	UFRN
reponame_str	Repositório Institucional da UFRN
collection	Repositório Institucional da UFRN
bitstream.url.fl_str_mv	https://repositorio.ufrn.br/bitstream/123456789/15124/1/AdrianoAB.pdf https://repositorio.ufrn.br/bitstream/123456789/15124/6/AdrianoAB.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/15124/7/AdrianoAB.pdf.jpg
bitstream.checksum.fl_str_mv	d9e93de6b9ef6f0023ed591b4d760ff9 efd7a6ce4b01db1ea92ac2a4b4e3de8a 2a881de656d179a5b90fe353ce985b98
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_	1802117797217566720

Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão

Registros relacionados