Classificação fonética utilizando Boosting e SVM
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPA |
Texto Completo: | http://repositorio.ufpa.br/jspui/2011/2533 |
Resumo: | Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros. |
id |
UFPA_ed99f14bc7c6738ffaf60e8932de995c |
---|---|
oai_identifier_str |
oai:repositorio.ufpa.br:2011/2533 |
network_acronym_str |
UFPA |
network_name_str |
Repositório Institucional da UFPA |
repository_id_str |
2123 |
spelling |
2012-03-07T12:40:11Z2012-03-07T12:40:11Z2006-02-17TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.http://repositorio.ufpa.br/jspui/2011/2533Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.With the aim of setting up a Automatic Speech Recognition (ASR) system, a task named Phonetic Classification can be used. That task consists in, from a speech sample, deciding which phoneme was pronounced by a speaker. To ease the classification task and to enhance the most marked characteristics of the phonemes, the speech samples are usually pre-processed by a front-end. A front-end, as a general rule, extracts a set of features to each speech sample. After that, these features are inserted in a classification algorithm, that (already properly trained) will try to decide which phoneme was pronounced. There is a rule of thumb which says that the more features the system uses, the smaller the classification error rate will be. The disadvantage to that is the larger computational cost. Feature Selection task aims to show which are the most relevant (or more used) features in a classification task. Therefore, it is possible to discover which are the redundant features, that make little (or no) contribution to the classification task. The aim of this work is to apply SVM classificator in Phonetic Classification task, using TIMIT database, and discover the most relevant features in this classification using Boosting approach to implement Feature Selection.porUniversidade Federal do ParáPrograma de Pós-Graduação em Engenharia ElétricaUFPABrasilInstituto de TecnologiaCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOESClassificação fonéticaSistema de processamento da falaFonemaSVMClassificação fonética utilizando Boosting e SVMinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisKLAUTAU JÚNIOR, Aldebaro Barreto da Rochahttp://lattes.cnpq.br/1596629769697284PELAES, Evaldo Gonçalveshttp://lattes.cnpq.br/0255430734381362http://lattes.cnpq.br/7170570696996491TEIXEIRA JÚNIOR, Talisman Cláudio de Queirozinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPACC-LICENSElicense_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/2533/2/license_url3d480ae6c91e310daba2020f8787d6f9MD52license_textlicense_texttext/html; charset=utf-80http://repositorio.ufpa.br/oai/bitstream/2011/2533/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823898http://repositorio.ufpa.br/oai/bitstream/2011/2533/4/license_rdfe363e809996cf46ada20da1accfcd9c7MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufpa.br/oai/bitstream/2011/2533/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALDissertacao_ClassificacaoFoneticaUtilizando.pdfDissertacao_ClassificacaoFoneticaUtilizando.pdfapplication/pdf1955954http://repositorio.ufpa.br/oai/bitstream/2011/2533/6/Dissertacao_ClassificacaoFoneticaUtilizando.pdf7684640d4ce1707a9ecabff1c53b3144MD56TEXTDissertacao_ClassificacaoFoneticaUtilizando.pdf.txtDissertacao_ClassificacaoFoneticaUtilizando.pdf.txtExtracted texttext/plain114783http://repositorio.ufpa.br/oai/bitstream/2011/2533/7/Dissertacao_ClassificacaoFoneticaUtilizando.pdf.txt64bbc3d808f2080932c40caa044baaafMD572011/25332017-12-22 10:58:47.825oai:repositorio.ufpa.br:2011/2533Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232017-12-22T13:58:47Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false |
dc.title.pt_BR.fl_str_mv |
Classificação fonética utilizando Boosting e SVM |
title |
Classificação fonética utilizando Boosting e SVM |
spellingShingle |
Classificação fonética utilizando Boosting e SVM TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES Classificação fonética Sistema de processamento da fala Fonema SVM |
title_short |
Classificação fonética utilizando Boosting e SVM |
title_full |
Classificação fonética utilizando Boosting e SVM |
title_fullStr |
Classificação fonética utilizando Boosting e SVM |
title_full_unstemmed |
Classificação fonética utilizando Boosting e SVM |
title_sort |
Classificação fonética utilizando Boosting e SVM |
author |
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz |
author_facet |
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1596629769697284 |
dc.contributor.advisor-co1.fl_str_mv |
PELAES, Evaldo Gonçalves |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/0255430734381362 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7170570696996491 |
dc.contributor.author.fl_str_mv |
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz |
contributor_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha PELAES, Evaldo Gonçalves |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES Classificação fonética Sistema de processamento da fala Fonema SVM |
dc.subject.por.fl_str_mv |
Classificação fonética Sistema de processamento da fala Fonema SVM |
description |
Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros. |
publishDate |
2006 |
dc.date.issued.fl_str_mv |
2006-02-17 |
dc.date.accessioned.fl_str_mv |
2012-03-07T12:40:11Z |
dc.date.available.fl_str_mv |
2012-03-07T12:40:11Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufpa.br/jspui/2011/2533 |
identifier_str_mv |
TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. |
url |
http://repositorio.ufpa.br/jspui/2011/2533 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFPA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Tecnologia |
publisher.none.fl_str_mv |
Universidade Federal do Pará |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPA instname:Universidade Federal do Pará (UFPA) instacron:UFPA |
instname_str |
Universidade Federal do Pará (UFPA) |
instacron_str |
UFPA |
institution |
UFPA |
reponame_str |
Repositório Institucional da UFPA |
collection |
Repositório Institucional da UFPA |
bitstream.url.fl_str_mv |
http://repositorio.ufpa.br/oai/bitstream/2011/2533/2/license_url http://repositorio.ufpa.br/oai/bitstream/2011/2533/3/license_text http://repositorio.ufpa.br/oai/bitstream/2011/2533/4/license_rdf http://repositorio.ufpa.br/oai/bitstream/2011/2533/5/license.txt http://repositorio.ufpa.br/oai/bitstream/2011/2533/6/Dissertacao_ClassificacaoFoneticaUtilizando.pdf http://repositorio.ufpa.br/oai/bitstream/2011/2533/7/Dissertacao_ClassificacaoFoneticaUtilizando.pdf.txt |
bitstream.checksum.fl_str_mv |
3d480ae6c91e310daba2020f8787d6f9 d41d8cd98f00b204e9800998ecf8427e e363e809996cf46ada20da1accfcd9c7 8a4605be74aa9ea9d79846c1fba20a33 7684640d4ce1707a9ecabff1c53b3144 64bbc3d808f2080932c40caa044baaaf |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA) |
repository.mail.fl_str_mv |
riufpabc@ufpa.br |
_version_ |
1801771826615943168 |