Reconhecimento automático de palavras

Detalhes bibliográficos
Autor(a) principal: Ishizaki, Mauricio Yoiti
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/7154
Resumo: Reconhecimento automático de palavras é a tradução da fala humana para texto, o qual se mostrou útil na comunicação homem - computador. Por este motivo, várias pesquisas foram feitas nesta área e consequentemente aplicações, como assistentes virtuais, surgiram para facilitar a vida das pessoas. No entanto, pessoas que sofrem com alguma disfonia (rouquidão) não conseguem desfrutar totalmente destas aplicações, devido às distorções da voz. Este trabalho propõe a utilização de Redes Neurais Convolucionais (CNNs) para fazer o reconhecimento de palavras faladas com esse tipo de distorção. Utilizou-se uma base de dados de 20 palavras com 28 amostras, sendo todas as vozes de diferentes pessoas disfônicas. Foram criadas diversas topologias para a CNN, variando alguns hiperparâmetros da rede. Foi feito o treinamento e teste de cada uma dela. Para o conjunto de teste, a topologia com maior acurácia obteve um resultado de 82,50%.
id UTFPR-12_0f541f061110b4df7bd8fd675cf2fc0a
oai_identifier_str oai:repositorio.utfpr.edu.br:1/7154
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-10T17:54:58Z2020-11-10T17:54:58Z2018-06-19ISHIZAKI, Mauricio Yoiti. Reconhecimento automático de palavras. 2018. 43 f. Trabalho de Conclusão de curso (Graduação em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/7154Reconhecimento automático de palavras é a tradução da fala humana para texto, o qual se mostrou útil na comunicação homem - computador. Por este motivo, várias pesquisas foram feitas nesta área e consequentemente aplicações, como assistentes virtuais, surgiram para facilitar a vida das pessoas. No entanto, pessoas que sofrem com alguma disfonia (rouquidão) não conseguem desfrutar totalmente destas aplicações, devido às distorções da voz. Este trabalho propõe a utilização de Redes Neurais Convolucionais (CNNs) para fazer o reconhecimento de palavras faladas com esse tipo de distorção. Utilizou-se uma base de dados de 20 palavras com 28 amostras, sendo todas as vozes de diferentes pessoas disfônicas. Foram criadas diversas topologias para a CNN, variando alguns hiperparâmetros da rede. Foi feito o treinamento e teste de cada uma dela. Para o conjunto de teste, a topologia com maior acurácia obteve um resultado de 82,50%.Automatic word recognition is the translation of human speech into text, which has proved useful in man - computer communication. For this reason, several researches were developed in this area and consequently applications, such as virtual assistants, have arisen to make life easier for people. However, people who suffer from any dysphonia (hoarseness) can’t fully enjoy these applications, due to the distortions in their voice. This paper proposes the use of Convolutional Neural Networks (CNNs) to make the recognition of spoken words with this type of distortion. A database of 20 words with 28 samples was used, all voices were from different dysphonic people. Several topology were created for CNN, varying some hyperparameters of the network. All topologies were training and testing. For the test set, the topology with the highest accuracy obtained a result of 82,50%.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia de Controle e AutomaçãoUTFPRBrasilEngenhariasSistemas de reconhecimento de padrõesRedes neurais (Computação)Processamento de palavrasPattern recognition systemsNeural networks (Computer science)Word processingReconhecimento automático de palavrasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioDajer, María EugeniaSpatti, Danilo HernaneDajer, María EugeniaSpatti, Danilo HernaneAgulhari, Cristiano MarcosGoedtel, AlessandroIshizaki, Mauricio Yoitiinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRLICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/1/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD51ORIGINALCP_COEAU_2018_1_09.pdfapplication/pdf1095452http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/2/CP_COEAU_2018_1_09.pdf72002ea60e7e92c26b1b70f4f213cf07MD52TEXTCP_COEAU_2018_1_09.pdf.txtExtracted texttext/plain58086http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/3/CP_COEAU_2018_1_09.pdf.txt45eab44f372ac261a49dbb48f5a581ccMD53THUMBNAILCP_COEAU_2018_1_09.pdf.jpgGenerated Thumbnailimage/jpeg1245http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/4/CP_COEAU_2018_1_09.pdf.jpg3d8af9ff26acd03e0b3f5ac3bd2e3239MD541/71542020-11-10 15:54:58.634oai:repositorio.utfpr.edu.br:1/7154TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-10T17:54:58Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Reconhecimento automático de palavras
title Reconhecimento automático de palavras
spellingShingle Reconhecimento automático de palavras
Ishizaki, Mauricio Yoiti
Engenharias
Sistemas de reconhecimento de padrões
Redes neurais (Computação)
Processamento de palavras
Pattern recognition systems
Neural networks (Computer science)
Word processing
title_short Reconhecimento automático de palavras
title_full Reconhecimento automático de palavras
title_fullStr Reconhecimento automático de palavras
title_full_unstemmed Reconhecimento automático de palavras
title_sort Reconhecimento automático de palavras
author Ishizaki, Mauricio Yoiti
author_facet Ishizaki, Mauricio Yoiti
author_role author
dc.contributor.advisor1.fl_str_mv Dajer, María Eugenia
dc.contributor.advisor-co1.fl_str_mv Spatti, Danilo Hernane
dc.contributor.referee1.fl_str_mv Dajer, María Eugenia
dc.contributor.referee2.fl_str_mv Spatti, Danilo Hernane
dc.contributor.referee3.fl_str_mv Agulhari, Cristiano Marcos
dc.contributor.referee4.fl_str_mv Goedtel, Alessandro
dc.contributor.author.fl_str_mv Ishizaki, Mauricio Yoiti
contributor_str_mv Dajer, María Eugenia
Spatti, Danilo Hernane
Dajer, María Eugenia
Spatti, Danilo Hernane
Agulhari, Cristiano Marcos
Goedtel, Alessandro
dc.subject.cnpq.fl_str_mv Engenharias
topic Engenharias
Sistemas de reconhecimento de padrões
Redes neurais (Computação)
Processamento de palavras
Pattern recognition systems
Neural networks (Computer science)
Word processing
dc.subject.por.fl_str_mv Sistemas de reconhecimento de padrões
Redes neurais (Computação)
Processamento de palavras
Pattern recognition systems
Neural networks (Computer science)
Word processing
description Reconhecimento automático de palavras é a tradução da fala humana para texto, o qual se mostrou útil na comunicação homem - computador. Por este motivo, várias pesquisas foram feitas nesta área e consequentemente aplicações, como assistentes virtuais, surgiram para facilitar a vida das pessoas. No entanto, pessoas que sofrem com alguma disfonia (rouquidão) não conseguem desfrutar totalmente destas aplicações, devido às distorções da voz. Este trabalho propõe a utilização de Redes Neurais Convolucionais (CNNs) para fazer o reconhecimento de palavras faladas com esse tipo de distorção. Utilizou-se uma base de dados de 20 palavras com 28 amostras, sendo todas as vozes de diferentes pessoas disfônicas. Foram criadas diversas topologias para a CNN, variando alguns hiperparâmetros da rede. Foi feito o treinamento e teste de cada uma dela. Para o conjunto de teste, a topologia com maior acurácia obteve um resultado de 82,50%.
publishDate 2018
dc.date.issued.fl_str_mv 2018-06-19
dc.date.accessioned.fl_str_mv 2020-11-10T17:54:58Z
dc.date.available.fl_str_mv 2020-11-10T17:54:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ISHIZAKI, Mauricio Yoiti. Reconhecimento automático de palavras. 2018. 43 f. Trabalho de Conclusão de curso (Graduação em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/7154
identifier_str_mv ISHIZAKI, Mauricio Yoiti. Reconhecimento automático de palavras. 2018. 43 f. Trabalho de Conclusão de curso (Graduação em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/7154
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Engenharia de Controle e Automação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/1/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/2/CP_COEAU_2018_1_09.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/3/CP_COEAU_2018_1_09.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/7154/4/CP_COEAU_2018_1_09.pdf.jpg
bitstream.checksum.fl_str_mv b9d82215ab23456fa2d8b49c5df1b95b
72002ea60e7e92c26b1b70f4f213cf07
45eab44f372ac261a49dbb48f5a581cc
3d8af9ff26acd03e0b3f5ac3bd2e3239
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797043976014921728