Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242 |
Resumo: | O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio. |
id |
UFCG_e4b00ebae176fbccd6a59aaaaf7eba00 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/29242 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
CAMPELO, Claudio Elízio Calazans.CAMPELO, C. E. C.http://lattes.cnpq.br/2042247762832979PIRES, Carlos Eduardo Santos.PIRES, C. E. S.BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897ALMEIDA, D. R.ALMEIDA, Diego Ribeiro de.Submitted by Renata Cardoso (renaatachaves97@hotmail.com) on 2023-04-04T21:42:12Z No. of bitstreams: 1 DIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf: 420691 bytes, checksum: cd20c0a4f3921a52ee0ecb73563001b0 (MD5)Made available in DSpace on 2023-04-04T21:42:12Z (GMT). No. of bitstreams: 1 DIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf: 420691 bytes, checksum: cd20c0a4f3921a52ee0ecb73563001b0 (MD5) Previous issue date: 2022-09-02O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio.Universidade Federal de Campina GrandeUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.Sotaques brasileirosSistemas de automatic speech recognitionClassificação de sotaquesBraccent - base de dadosReconhecimento automático de falaIdentificação de sotaquesRegressão logística multiclasseCoeficientes cepstrais - MelMel frequency cepstral coefficientsBrazilian accentsAutomatic speech recognition systemsAccent ratingBraccent - databaseAutomatic speech recognitionAccent identificationMulticlass logistic regressionComparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.Comparison between models with different approaches for classifying Brazilian accents.2022-09-022023-04-04T21:42:12Z2023-04-042023-04-04T21:42:12Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfDIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfapplication/pdf420691http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/1/DIEGO+RIBEIRO+DE+ALMEIDA+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2022.pdfcd20c0a4f3921a52ee0ecb73563001b0MD51riufcg/292422023-04-04 18:43:35.636oai:localhost:riufcg/29242Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512023-04-04T21:43:35Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.pt_BR.fl_str_mv |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
dc.title.alternative.pt_BR.fl_str_mv |
Comparison between models with different approaches for classifying Brazilian accents. |
title |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
spellingShingle |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. ALMEIDA, Diego Ribeiro de. Ciência da Computação. Sotaques brasileiros Sistemas de automatic speech recognition Classificação de sotaques Braccent - base de dados Reconhecimento automático de fala Identificação de sotaques Regressão logística multiclasse Coeficientes cepstrais - Mel Mel frequency cepstral coefficients Brazilian accents Automatic speech recognition systems Accent rating Braccent - database Automatic speech recognition Accent identification Multiclass logistic regression |
title_short |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
title_full |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
title_fullStr |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
title_full_unstemmed |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
title_sort |
Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. |
author |
ALMEIDA, Diego Ribeiro de. |
author_facet |
ALMEIDA, Diego Ribeiro de. |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
CAMPELO, Claudio Elízio Calazans. |
dc.contributor.advisor1ID.fl_str_mv |
CAMPELO, C. E. C. |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2042247762832979 |
dc.contributor.referee1.fl_str_mv |
PIRES, Carlos Eduardo Santos. |
dc.contributor.referee1ID.fl_str_mv |
PIRES, C. E. S. |
dc.contributor.referee2.fl_str_mv |
BRASILEIRO, Francisco Vilar. |
dc.contributor.referee2ID.fl_str_mv |
BRASILEIRO, F. V. |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/5957855817378897 |
dc.contributor.authorID.fl_str_mv |
ALMEIDA, D. R. |
dc.contributor.author.fl_str_mv |
ALMEIDA, Diego Ribeiro de. |
contributor_str_mv |
CAMPELO, Claudio Elízio Calazans. PIRES, Carlos Eduardo Santos. BRASILEIRO, Francisco Vilar. |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação. |
topic |
Ciência da Computação. Sotaques brasileiros Sistemas de automatic speech recognition Classificação de sotaques Braccent - base de dados Reconhecimento automático de fala Identificação de sotaques Regressão logística multiclasse Coeficientes cepstrais - Mel Mel frequency cepstral coefficients Brazilian accents Automatic speech recognition systems Accent rating Braccent - database Automatic speech recognition Accent identification Multiclass logistic regression |
dc.subject.por.fl_str_mv |
Sotaques brasileiros Sistemas de automatic speech recognition Classificação de sotaques Braccent - base de dados Reconhecimento automático de fala Identificação de sotaques Regressão logística multiclasse Coeficientes cepstrais - Mel Mel frequency cepstral coefficients Brazilian accents Automatic speech recognition systems Accent rating Braccent - database Automatic speech recognition Accent identification Multiclass logistic regression |
description |
O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-09-02 |
dc.date.accessioned.fl_str_mv |
2023-04-04T21:42:12Z |
dc.date.available.fl_str_mv |
2023-04-04 2023-04-04T21:42:12Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242 |
dc.identifier.citation.fl_str_mv |
ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242 |
identifier_str_mv |
ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.publisher.initials.fl_str_mv |
UFCG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
bitstream.url.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/2/license.txt http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/1/DIEGO+RIBEIRO+DE+ALMEIDA+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2022.pdf |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 cd20c0a4f3921a52ee0ecb73563001b0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1797044480618004480 |