Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais

Detalhes bibliográficos
Autor(a) principal: Viana, Luiz Alberto Guimarães
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFBA
Texto Completo: https://repositorio.ufba.br/handle/ri/36909
Resumo: A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.
id UFBA-2_b8fff82579d8506d031f288c28e6e0ad
oai_identifier_str oai:repositorio.ufba.br:ri/36909
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling 2023-04-24T11:26:59Z2023-04-24T11:26:59Z2023-02-13VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.https://repositorio.ufba.br/handle/ri/36909A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.Audio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets.Submitted by Luiz Alberto Guimarães Viana (luiz.guimaraes@ufba.br) on 2023-04-11T14:12:27Z No. of bitstreams: 2 license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5) Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5)Approved for entry into archive by Biblioteca Engenharia Processamento Técnico (biengproc@ufba.br) on 2023-04-24T11:26:59Z (GMT) No. of bitstreams: 2 Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5) license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5)Made available in DSpace on 2023-04-24T11:26:59Z (GMT). No. of bitstreams: 2 Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5) license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5) Previous issue date: 2023-02-13porUniversidade Federal da BahiaDepartamento de Engenharia Elétrica (DEEC) UFBABrasilEscola PolitécnicaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessAudio tempo estimationMusical tempoWaveletScalogramConvolutional neural networksData augmentationMusical information retrieval (MIR)CNPQ::ENGENHARIAS::ENGENHARIA ELETRICAAndamento musicalWaveletEscalogramaRede neural convolucionalAumento artificial de dadosEstimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionaisMestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionFernandes Júnior, Antônio Carlos Lopeshttp://lattes.cnpq.br/2586671440653430http://lattes.cnpq.br/6012321412801915Simas Filho, Eduardo Furtado deFernandes Júnior, Antônio Carlos LopesSimas Filho, Eduardo Furtado deMontalvão Filho, Jugurta RosaPrates, Ricardo MenezesAttux, Romis Ribeiro de Fassoilhttp://lattes.cnpq.br/4552555694780012Viana, Luiz Alberto Guimarãesreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBATEXTDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf.txtDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf.txtExtracted texttext/plain3687https://repositorio.ufba.br/bitstream/ri/36909/5/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf.txt640d1e63623319ca444c7bdb872a0961MD55ORIGINALDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfViana, L. A. G. - Estimativa de Andamento Musicalapplication/pdf49423045https://repositorio.ufba.br/bitstream/ri/36909/2/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf0a91ab96ae54d6ee7bfff01ed502d351MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufba.br/bitstream/ri/36909/3/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD53LICENSElicense.txtlicense.txttext/plain1715https://repositorio.ufba.br/bitstream/ri/36909/4/license.txt67bf4f75790b0d8d38d8f112a48ad90bMD54ri/369092023-04-29 02:04:16.514oai:repositorio.ufba.br:ri/36909TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIG5vIGZvcm1hdG8gaW1wcmVzc28gZS9vdSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyAKZm9ybWF0b3Mgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gZS9vdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLCBwb2RlbmRvIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSBwdWJsaWNhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBICBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSAgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08sIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28gZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322023-04-29T05:04:16Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
title Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
spellingShingle Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
Viana, Luiz Alberto Guimarães
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Andamento musical
Wavelet
Escalograma
Rede neural convolucional
Aumento artificial de dados
Audio tempo estimation
Musical tempo
Wavelet
Scalogram
Convolutional neural networks
Data augmentation
Musical information retrieval (MIR)
title_short Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
title_full Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
title_fullStr Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
title_full_unstemmed Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
title_sort Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
author Viana, Luiz Alberto Guimarães
author_facet Viana, Luiz Alberto Guimarães
author_role author
dc.contributor.advisor1.fl_str_mv Fernandes Júnior, Antônio Carlos Lopes
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2586671440653430
dc.contributor.advisor2Lattes.fl_str_mv http://lattes.cnpq.br/6012321412801915
dc.contributor.advisor-co1.fl_str_mv Simas Filho, Eduardo Furtado de
dc.contributor.referee1.fl_str_mv Fernandes Júnior, Antônio Carlos Lopes
dc.contributor.referee2.fl_str_mv Simas Filho, Eduardo Furtado de
dc.contributor.referee3.fl_str_mv Montalvão Filho, Jugurta Rosa
dc.contributor.referee4.fl_str_mv Prates, Ricardo Menezes
dc.contributor.referee5.fl_str_mv Attux, Romis Ribeiro de Fassoil
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4552555694780012
dc.contributor.author.fl_str_mv Viana, Luiz Alberto Guimarães
contributor_str_mv Fernandes Júnior, Antônio Carlos Lopes
Simas Filho, Eduardo Furtado de
Fernandes Júnior, Antônio Carlos Lopes
Simas Filho, Eduardo Furtado de
Montalvão Filho, Jugurta Rosa
Prates, Ricardo Menezes
Attux, Romis Ribeiro de Fassoil
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Andamento musical
Wavelet
Escalograma
Rede neural convolucional
Aumento artificial de dados
Audio tempo estimation
Musical tempo
Wavelet
Scalogram
Convolutional neural networks
Data augmentation
Musical information retrieval (MIR)
dc.subject.por.fl_str_mv Andamento musical
Wavelet
Escalograma
Rede neural convolucional
Aumento artificial de dados
dc.subject.other.pt_BR.fl_str_mv Audio tempo estimation
Musical tempo
Wavelet
Scalogram
Convolutional neural networks
Data augmentation
Musical information retrieval (MIR)
description A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-04-24T11:26:59Z
dc.date.available.fl_str_mv 2023-04-24T11:26:59Z
dc.date.issued.fl_str_mv 2023-02-13
dc.type.driver.fl_str_mv Mestrado Acadêmico
info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/36909
identifier_str_mv VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.
url https://repositorio.ufba.br/handle/ri/36909
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Departamento de Engenharia Elétrica (DEEC) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/36909/5/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf.txt
https://repositorio.ufba.br/bitstream/ri/36909/2/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf
https://repositorio.ufba.br/bitstream/ri/36909/3/license_rdf
https://repositorio.ufba.br/bitstream/ri/36909/4/license.txt
bitstream.checksum.fl_str_mv 640d1e63623319ca444c7bdb872a0961
0a91ab96ae54d6ee7bfff01ed502d351
4d2950bda3d176f570a9f8b328dfbbef
67bf4f75790b0d8d38d8f112a48ad90b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1808459661944291328