Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.

Detalhes bibliográficos
Autor(a) principal: ALMEIDA, Diego Ribeiro de.
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242
Resumo: O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio.
id UFCG_e4b00ebae176fbccd6a59aaaaf7eba00
oai_identifier_str oai:localhost:riufcg/29242
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling CAMPELO, Claudio Elízio Calazans.CAMPELO, C. E. C.http://lattes.cnpq.br/2042247762832979PIRES, Carlos Eduardo Santos.PIRES, C. E. S.BRASILEIRO, Francisco Vilar.BRASILEIRO, F. V.http://lattes.cnpq.br/5957855817378897ALMEIDA, D. R.ALMEIDA, Diego Ribeiro de.Submitted by Renata Cardoso (renaatachaves97@hotmail.com) on 2023-04-04T21:42:12Z No. of bitstreams: 1 DIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf: 420691 bytes, checksum: cd20c0a4f3921a52ee0ecb73563001b0 (MD5)Made available in DSpace on 2023-04-04T21:42:12Z (GMT). No. of bitstreams: 1 DIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf: 420691 bytes, checksum: cd20c0a4f3921a52ee0ecb73563001b0 (MD5) Previous issue date: 2022-09-02O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio.Universidade Federal de Campina GrandeUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.Sotaques brasileirosSistemas de automatic speech recognitionClassificação de sotaquesBraccent - base de dadosReconhecimento automático de falaIdentificação de sotaquesRegressão logística multiclasseCoeficientes cepstrais - MelMel frequency cepstral coefficientsBrazilian accentsAutomatic speech recognition systemsAccent ratingBraccent - databaseAutomatic speech recognitionAccent identificationMulticlass logistic regressionComparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.Comparison between models with different approaches for classifying Brazilian accents.2022-09-022023-04-04T21:42:12Z2023-04-042023-04-04T21:42:12Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALDIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfDIEGO RIBEIRO DE ALMEIDA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfapplication/pdf420691http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/1/DIEGO+RIBEIRO+DE+ALMEIDA+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2022.pdfcd20c0a4f3921a52ee0ecb73563001b0MD51riufcg/292422023-04-04 18:43:35.636oai:localhost:riufcg/29242Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512023-04-04T21:43:35Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
dc.title.alternative.pt_BR.fl_str_mv Comparison between models with different approaches for classifying Brazilian accents.
title Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
spellingShingle Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
ALMEIDA, Diego Ribeiro de.
Ciência da Computação.
Sotaques brasileiros
Sistemas de automatic speech recognition
Classificação de sotaques
Braccent - base de dados
Reconhecimento automático de fala
Identificação de sotaques
Regressão logística multiclasse
Coeficientes cepstrais - Mel
Mel frequency cepstral coefficients
Brazilian accents
Automatic speech recognition systems
Accent rating
Braccent - database
Automatic speech recognition
Accent identification
Multiclass logistic regression
title_short Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
title_full Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
title_fullStr Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
title_full_unstemmed Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
title_sort Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros.
author ALMEIDA, Diego Ribeiro de.
author_facet ALMEIDA, Diego Ribeiro de.
author_role author
dc.contributor.advisor1.fl_str_mv CAMPELO, Claudio Elízio Calazans.
dc.contributor.advisor1ID.fl_str_mv CAMPELO, C. E. C.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2042247762832979
dc.contributor.referee1.fl_str_mv PIRES, Carlos Eduardo Santos.
dc.contributor.referee1ID.fl_str_mv PIRES, C. E. S.
dc.contributor.referee2.fl_str_mv BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID.fl_str_mv BRASILEIRO, F. V.
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/5957855817378897
dc.contributor.authorID.fl_str_mv ALMEIDA, D. R.
dc.contributor.author.fl_str_mv ALMEIDA, Diego Ribeiro de.
contributor_str_mv CAMPELO, Claudio Elízio Calazans.
PIRES, Carlos Eduardo Santos.
BRASILEIRO, Francisco Vilar.
dc.subject.cnpq.fl_str_mv Ciência da Computação.
topic Ciência da Computação.
Sotaques brasileiros
Sistemas de automatic speech recognition
Classificação de sotaques
Braccent - base de dados
Reconhecimento automático de fala
Identificação de sotaques
Regressão logística multiclasse
Coeficientes cepstrais - Mel
Mel frequency cepstral coefficients
Brazilian accents
Automatic speech recognition systems
Accent rating
Braccent - database
Automatic speech recognition
Accent identification
Multiclass logistic regression
dc.subject.por.fl_str_mv Sotaques brasileiros
Sistemas de automatic speech recognition
Classificação de sotaques
Braccent - base de dados
Reconhecimento automático de fala
Identificação de sotaques
Regressão logística multiclasse
Coeficientes cepstrais - Mel
Mel frequency cepstral coefficients
Brazilian accents
Automatic speech recognition systems
Accent rating
Braccent - database
Automatic speech recognition
Accent identification
Multiclass logistic regression
description O sotaque se apresenta como uma das variáveis mais desaiadoras para a eicácia de sistemas de Automatic Speech Recognition. Além disso, sua classiicação automática possui diversas aplicações potenciais, como a seleção de modelos especializados para text-tospeech e speech-to-text. Neste trabalho, avaliamos dois modelos de classiicação de sotaques a partir da base de dados Braccent, a im de compará-los com os métodos GMM-UBM, GMM-SVM, iVector, CNN 1D, CNN 2D e CNN 1D + LSTM. Os resultados experimentais obtidos demonstram que as abordagens aqui avaliadas apresentam desempenhos consideravelmente abaixo dos reportados na literatura em métricas como acurácia, precisão, revocação, e F1-score, corroborando com a premissa de que sistemas de reconhecimento automático de sotaques no português brasileiro ainda são um desaio.
publishDate 2022
dc.date.issued.fl_str_mv 2022-09-02
dc.date.accessioned.fl_str_mv 2023-04-04T21:42:12Z
dc.date.available.fl_str_mv 2023-04-04
2023-04-04T21:42:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242
dc.identifier.citation.fl_str_mv ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242
identifier_str_mv ALMEIDA, Diego Ribeiro de. Comparação entre modelos com diferentes abordagens para classificação de sotaques brasileiros. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29242
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharia Elétrica e Informática - CEEI
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/2/license.txt
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/29242/1/DIEGO+RIBEIRO+DE+ALMEIDA+-+TCC+ARTIGO+CI%C3%8ANCIA+DA+COMPUTA%C3%87%C3%83O+CEEI+2022.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
cd20c0a4f3921a52ee0ecb73563001b0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1797044480618004480