Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/27256 |
Resumo: | Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%. |
id |
UTFPR-12_d5f2ac30d23c22a4dc06f04efecc7ce3 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/27256 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2022-02-22T23:01:35Z2022-02-22T23:01:35Z2017-06-22PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/27256Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%.This work proposes an aid method for speech professionals, in clinical, scientific and pedagogical environments, since the classification of vocal samples into subjective parameters is extremely important for the diagnosis of pathologies and much used in the daily life of these professionals. Using previously recorded samples, the patient's voice is analyzed by means of acoustic parameters - energy and logarithmic entropy - extracted from the third level coefficients of the Wavelet Packet Transform. Subsequently these samples are classified by a set of artificial neural networks in roughness, breathiness or strain, all subjective parameters of the voice.In order to obtain a higher rate of accuracy, the study proposes the use of six artificial neural networks, each one specialized in the identification of one of the subjective parameters, also divided into female and male.The experimental results demonstrate that the proposed methodology can adequately generalize speech samples with a mean percentage of correctness of 96.33%.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia ElétricaUTFPRBrasilCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAClassificaçãoRedes Neurais ArtificiaisTransformadas integraisClassificationNeural networks (Computer science)Integral transformsClassificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioDajer, María EugeniaDajer, María EugeniaSpatti, Danilo HernaneBispo, Bruno CatarinoAgulhari, Cristiano MarcosPavoni, Higor Eduardoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_COELT_2017_1_13.pdfCP_COELT_2017_1_13.pdfapplication/pdf2410049http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/1/CP_COELT_2017_1_13.pdf3d60198ac55f2d2b4e98750e1357e80bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTCP_COELT_2017_1_13.pdf.txtCP_COELT_2017_1_13.pdf.txtExtracted texttext/plain108355http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/3/CP_COELT_2017_1_13.pdf.txta8eaf249ef00ffd0a9f1cc533af7b7bdMD53THUMBNAILCP_COELT_2017_1_13.pdf.jpgCP_COELT_2017_1_13.pdf.jpgGenerated Thumbnailimage/jpeg1332http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/4/CP_COELT_2017_1_13.pdf.jpg3beafa4f475605930be513db085dc204MD541/272562022-02-23 03:05:53.099oai:repositorio.utfpr.edu.br:1/27256TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-02-23T06:05:53Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
title |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
spellingShingle |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais Pavoni, Higor Eduardo CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Classificação Redes Neurais Artificiais Transformadas integrais Classification Neural networks (Computer science) Integral transforms |
title_short |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
title_full |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
title_fullStr |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
title_full_unstemmed |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
title_sort |
Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
author |
Pavoni, Higor Eduardo |
author_facet |
Pavoni, Higor Eduardo |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Dajer, María Eugenia |
dc.contributor.referee1.fl_str_mv |
Dajer, María Eugenia |
dc.contributor.referee2.fl_str_mv |
Spatti, Danilo Hernane |
dc.contributor.referee3.fl_str_mv |
Bispo, Bruno Catarino |
dc.contributor.referee4.fl_str_mv |
Agulhari, Cristiano Marcos |
dc.contributor.author.fl_str_mv |
Pavoni, Higor Eduardo |
contributor_str_mv |
Dajer, María Eugenia Dajer, María Eugenia Spatti, Danilo Hernane Bispo, Bruno Catarino Agulhari, Cristiano Marcos |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Classificação Redes Neurais Artificiais Transformadas integrais Classification Neural networks (Computer science) Integral transforms |
dc.subject.por.fl_str_mv |
Classificação Redes Neurais Artificiais Transformadas integrais Classification Neural networks (Computer science) Integral transforms |
description |
Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-06-22 |
dc.date.accessioned.fl_str_mv |
2022-02-22T23:01:35Z |
dc.date.available.fl_str_mv |
2022-02-22T23:01:35Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/27256 |
identifier_str_mv |
PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/27256 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.publisher.program.fl_str_mv |
Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/1/CP_COELT_2017_1_13.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/3/CP_COELT_2017_1_13.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/4/CP_COELT_2017_1_13.pdf.jpg |
bitstream.checksum.fl_str_mv |
3d60198ac55f2d2b4e98750e1357e80b b9d82215ab23456fa2d8b49c5df1b95b a8eaf249ef00ffd0a9f1cc533af7b7bd 3beafa4f475605930be513db085dc204 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805922991137095680 |