Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais

Detalhes bibliográficos
Autor(a) principal: Pavoni, Higor Eduardo
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/27256
Resumo: Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%.
id UTFPR-12_d5f2ac30d23c22a4dc06f04efecc7ce3
oai_identifier_str oai:repositorio.utfpr.edu.br:1/27256
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-02-22T23:01:35Z2022-02-22T23:01:35Z2017-06-22PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/27256Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%.This work proposes an aid method for speech professionals, in clinical, scientific and pedagogical environments, since the classification of vocal samples into subjective parameters is extremely important for the diagnosis of pathologies and much used in the daily life of these professionals. Using previously recorded samples, the patient's voice is analyzed by means of acoustic parameters - energy and logarithmic entropy - extracted from the third level coefficients of the Wavelet Packet Transform. Subsequently these samples are classified by a set of artificial neural networks in roughness, breathiness or strain, all subjective parameters of the voice.In order to obtain a higher rate of accuracy, the study proposes the use of six artificial neural networks, each one specialized in the identification of one of the subjective parameters, also divided into female and male.The experimental results demonstrate that the proposed methodology can adequately generalize speech samples with a mean percentage of correctness of 96.33%.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia ElétricaUTFPRBrasilCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAClassificaçãoRedes Neurais ArtificiaisTransformadas integraisClassificationNeural networks (Computer science)Integral transformsClassificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioDajer, María EugeniaDajer, María EugeniaSpatti, Danilo HernaneBispo, Bruno CatarinoAgulhari, Cristiano MarcosPavoni, Higor Eduardoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_COELT_2017_1_13.pdfCP_COELT_2017_1_13.pdfapplication/pdf2410049http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/1/CP_COELT_2017_1_13.pdf3d60198ac55f2d2b4e98750e1357e80bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTCP_COELT_2017_1_13.pdf.txtCP_COELT_2017_1_13.pdf.txtExtracted texttext/plain108355http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/3/CP_COELT_2017_1_13.pdf.txta8eaf249ef00ffd0a9f1cc533af7b7bdMD53THUMBNAILCP_COELT_2017_1_13.pdf.jpgCP_COELT_2017_1_13.pdf.jpgGenerated Thumbnailimage/jpeg1332http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/4/CP_COELT_2017_1_13.pdf.jpg3beafa4f475605930be513db085dc204MD541/272562022-02-23 03:05:53.099oai:repositorio.utfpr.edu.br:1/27256TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-02-23T06:05:53Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
title Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
spellingShingle Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
Pavoni, Higor Eduardo
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Classificação
Redes Neurais Artificiais
Transformadas integrais
Classification
Neural networks (Computer science)
Integral transforms
title_short Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
title_full Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
title_fullStr Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
title_full_unstemmed Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
title_sort Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
author Pavoni, Higor Eduardo
author_facet Pavoni, Higor Eduardo
author_role author
dc.contributor.advisor1.fl_str_mv Dajer, María Eugenia
dc.contributor.referee1.fl_str_mv Dajer, María Eugenia
dc.contributor.referee2.fl_str_mv Spatti, Danilo Hernane
dc.contributor.referee3.fl_str_mv Bispo, Bruno Catarino
dc.contributor.referee4.fl_str_mv Agulhari, Cristiano Marcos
dc.contributor.author.fl_str_mv Pavoni, Higor Eduardo
contributor_str_mv Dajer, María Eugenia
Dajer, María Eugenia
Spatti, Danilo Hernane
Bispo, Bruno Catarino
Agulhari, Cristiano Marcos
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Classificação
Redes Neurais Artificiais
Transformadas integrais
Classification
Neural networks (Computer science)
Integral transforms
dc.subject.por.fl_str_mv Classificação
Redes Neurais Artificiais
Transformadas integrais
Classification
Neural networks (Computer science)
Integral transforms
description Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%.
publishDate 2017
dc.date.issued.fl_str_mv 2017-06-22
dc.date.accessioned.fl_str_mv 2022-02-22T23:01:35Z
dc.date.available.fl_str_mv 2022-02-22T23:01:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/27256
identifier_str_mv PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.
url http://repositorio.utfpr.edu.br/jspui/handle/1/27256
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Engenharia Elétrica
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/1/CP_COELT_2017_1_13.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/3/CP_COELT_2017_1_13.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/27256/4/CP_COELT_2017_1_13.pdf.jpg
bitstream.checksum.fl_str_mv 3d60198ac55f2d2b4e98750e1357e80b
b9d82215ab23456fa2d8b49c5df1b95b
a8eaf249ef00ffd0a9f1cc533af7b7bd
3beafa4f475605930be513db085dc204
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797043921292886016