Classificação fonética utilizando Boosting e SVM

Detalhes bibliográficos
Autor(a) principal: TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPA
Texto Completo: http://repositorio.ufpa.br/jspui/2011/2533
Resumo: Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.
id UFPA_ed99f14bc7c6738ffaf60e8932de995c
oai_identifier_str oai:repositorio.ufpa.br:2011/2533
network_acronym_str UFPA
network_name_str Repositório Institucional da UFPA
repository_id_str 2123
spelling 2012-03-07T12:40:11Z2012-03-07T12:40:11Z2006-02-17TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.http://repositorio.ufpa.br/jspui/2011/2533Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.With the aim of setting up a Automatic Speech Recognition (ASR) system, a task named Phonetic Classification can be used. That task consists in, from a speech sample, deciding which phoneme was pronounced by a speaker. To ease the classification task and to enhance the most marked characteristics of the phonemes, the speech samples are usually pre-processed by a front-end. A front-end, as a general rule, extracts a set of features to each speech sample. After that, these features are inserted in a classification algorithm, that (already properly trained) will try to decide which phoneme was pronounced. There is a rule of thumb which says that the more features the system uses, the smaller the classification error rate will be. The disadvantage to that is the larger computational cost. Feature Selection task aims to show which are the most relevant (or more used) features in a classification task. Therefore, it is possible to discover which are the redundant features, that make little (or no) contribution to the classification task. The aim of this work is to apply SVM classificator in Phonetic Classification task, using TIMIT database, and discover the most relevant features in this classification using Boosting approach to implement Feature Selection.porUniversidade Federal do ParáPrograma de Pós-Graduação em Engenharia ElétricaUFPABrasilInstituto de TecnologiaCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOESClassificação fonéticaSistema de processamento da falaFonemaSVMClassificação fonética utilizando Boosting e SVMinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisKLAUTAU JÚNIOR, Aldebaro Barreto da Rochahttp://lattes.cnpq.br/1596629769697284PELAES, Evaldo Gonçalveshttp://lattes.cnpq.br/0255430734381362http://lattes.cnpq.br/7170570696996491TEIXEIRA JÚNIOR, Talisman Cláudio de Queirozinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPACC-LICENSElicense_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/2533/2/license_url3d480ae6c91e310daba2020f8787d6f9MD52license_textlicense_texttext/html; charset=utf-80http://repositorio.ufpa.br/oai/bitstream/2011/2533/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823898http://repositorio.ufpa.br/oai/bitstream/2011/2533/4/license_rdfe363e809996cf46ada20da1accfcd9c7MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufpa.br/oai/bitstream/2011/2533/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALDissertacao_ClassificacaoFoneticaUtilizando.pdfDissertacao_ClassificacaoFoneticaUtilizando.pdfapplication/pdf1955954http://repositorio.ufpa.br/oai/bitstream/2011/2533/6/Dissertacao_ClassificacaoFoneticaUtilizando.pdf7684640d4ce1707a9ecabff1c53b3144MD56TEXTDissertacao_ClassificacaoFoneticaUtilizando.pdf.txtDissertacao_ClassificacaoFoneticaUtilizando.pdf.txtExtracted texttext/plain114783http://repositorio.ufpa.br/oai/bitstream/2011/2533/7/Dissertacao_ClassificacaoFoneticaUtilizando.pdf.txt64bbc3d808f2080932c40caa044baaafMD572011/25332017-12-22 10:58:47.825oai:repositorio.ufpa.br:2011/2533Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232017-12-22T13:58:47Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false
dc.title.pt_BR.fl_str_mv Classificação fonética utilizando Boosting e SVM
title Classificação fonética utilizando Boosting e SVM
spellingShingle Classificação fonética utilizando Boosting e SVM
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
Classificação fonética
Sistema de processamento da fala
Fonema
SVM
title_short Classificação fonética utilizando Boosting e SVM
title_full Classificação fonética utilizando Boosting e SVM
title_fullStr Classificação fonética utilizando Boosting e SVM
title_full_unstemmed Classificação fonética utilizando Boosting e SVM
title_sort Classificação fonética utilizando Boosting e SVM
author TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
author_facet TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
author_role author
dc.contributor.advisor1.fl_str_mv KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1596629769697284
dc.contributor.advisor-co1.fl_str_mv PELAES, Evaldo Gonçalves
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/0255430734381362
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7170570696996491
dc.contributor.author.fl_str_mv TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
contributor_str_mv KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
PELAES, Evaldo Gonçalves
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
Classificação fonética
Sistema de processamento da fala
Fonema
SVM
dc.subject.por.fl_str_mv Classificação fonética
Sistema de processamento da fala
Fonema
SVM
description Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.
publishDate 2006
dc.date.issued.fl_str_mv 2006-02-17
dc.date.accessioned.fl_str_mv 2012-03-07T12:40:11Z
dc.date.available.fl_str_mv 2012-03-07T12:40:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.
dc.identifier.uri.fl_str_mv http://repositorio.ufpa.br/jspui/2011/2533
identifier_str_mv TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.
url http://repositorio.ufpa.br/jspui/2011/2533
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Pará
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFPA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Tecnologia
publisher.none.fl_str_mv Universidade Federal do Pará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPA
instname:Universidade Federal do Pará (UFPA)
instacron:UFPA
instname_str Universidade Federal do Pará (UFPA)
instacron_str UFPA
institution UFPA
reponame_str Repositório Institucional da UFPA
collection Repositório Institucional da UFPA
bitstream.url.fl_str_mv http://repositorio.ufpa.br/oai/bitstream/2011/2533/2/license_url
http://repositorio.ufpa.br/oai/bitstream/2011/2533/3/license_text
http://repositorio.ufpa.br/oai/bitstream/2011/2533/4/license_rdf
http://repositorio.ufpa.br/oai/bitstream/2011/2533/5/license.txt
http://repositorio.ufpa.br/oai/bitstream/2011/2533/6/Dissertacao_ClassificacaoFoneticaUtilizando.pdf
http://repositorio.ufpa.br/oai/bitstream/2011/2533/7/Dissertacao_ClassificacaoFoneticaUtilizando.pdf.txt
bitstream.checksum.fl_str_mv 3d480ae6c91e310daba2020f8787d6f9
d41d8cd98f00b204e9800998ecf8427e
e363e809996cf46ada20da1accfcd9c7
8a4605be74aa9ea9d79846c1fba20a33
7684640d4ce1707a9ecabff1c53b3144
64bbc3d808f2080932c40caa044baaaf
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)
repository.mail.fl_str_mv riufpabc@ufpa.br
_version_ 1801771826615943168