Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFBA |
Texto Completo: | https://repositorio.ufba.br/handle/ri/36909 |
Resumo: | A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon. |
id |
UFBA-2_b8fff82579d8506d031f288c28e6e0ad |
---|---|
oai_identifier_str |
oai:repositorio.ufba.br:ri/36909 |
network_acronym_str |
UFBA-2 |
network_name_str |
Repositório Institucional da UFBA |
repository_id_str |
1932 |
spelling |
2023-04-24T11:26:59Z2023-04-24T11:26:59Z2023-02-13VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.https://repositorio.ufba.br/handle/ri/36909A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.Audio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets.Submitted by Luiz Alberto Guimarães Viana (luiz.guimaraes@ufba.br) on 2023-04-11T14:12:27Z No. of bitstreams: 2 license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5) Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5)Approved for entry into archive by Biblioteca Engenharia Processamento Técnico (biengproc@ufba.br) on 2023-04-24T11:26:59Z (GMT) No. of bitstreams: 2 Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5) license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5)Made available in DSpace on 2023-04-24T11:26:59Z (GMT). No. of bitstreams: 2 Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf: 49423045 bytes, checksum: 0a91ab96ae54d6ee7bfff01ed502d351 (MD5) license_rdf: 914 bytes, checksum: 4d2950bda3d176f570a9f8b328dfbbef (MD5) Previous issue date: 2023-02-13porUniversidade Federal da BahiaDepartamento de Engenharia Elétrica (DEEC) UFBABrasilEscola PolitécnicaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessAudio tempo estimationMusical tempoWaveletScalogramConvolutional neural networksData augmentationMusical information retrieval (MIR)CNPQ::ENGENHARIAS::ENGENHARIA ELETRICAAndamento musicalWaveletEscalogramaRede neural convolucionalAumento artificial de dadosEstimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionaisMestrado Acadêmicoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionFernandes Júnior, Antônio Carlos Lopeshttp://lattes.cnpq.br/2586671440653430http://lattes.cnpq.br/6012321412801915Simas Filho, Eduardo Furtado deFernandes Júnior, Antônio Carlos LopesSimas Filho, Eduardo Furtado deMontalvão Filho, Jugurta RosaPrates, Ricardo MenezesAttux, Romis Ribeiro de Fassoilhttp://lattes.cnpq.br/4552555694780012Viana, Luiz Alberto Guimarãesreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBATEXTDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf.txtDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf.txtExtracted texttext/plain3687https://repositorio.ufba.br/bitstream/ri/36909/5/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf.txt640d1e63623319ca444c7bdb872a0961MD55ORIGINALDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfDissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfViana, L. A. G. - Estimativa de Andamento Musicalapplication/pdf49423045https://repositorio.ufba.br/bitstream/ri/36909/2/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf0a91ab96ae54d6ee7bfff01ed502d351MD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufba.br/bitstream/ri/36909/3/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD53LICENSElicense.txtlicense.txttext/plain1715https://repositorio.ufba.br/bitstream/ri/36909/4/license.txt67bf4f75790b0d8d38d8f112a48ad90bMD54ri/369092023-04-29 02:04:16.514oai:repositorio.ufba.br:ri/36909TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIG5vIGZvcm1hdG8gaW1wcmVzc28gZS9vdSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyAKZm9ybWF0b3Mgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gZS9vdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLCBwb2RlbmRvIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSBwdWJsaWNhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBICBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSAgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08sIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28gZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322023-04-29T05:04:16Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false |
dc.title.pt_BR.fl_str_mv |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
title |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
spellingShingle |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais Viana, Luiz Alberto Guimarães CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Andamento musical Wavelet Escalograma Rede neural convolucional Aumento artificial de dados Audio tempo estimation Musical tempo Wavelet Scalogram Convolutional neural networks Data augmentation Musical information retrieval (MIR) |
title_short |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
title_full |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
title_fullStr |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
title_full_unstemmed |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
title_sort |
Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
author |
Viana, Luiz Alberto Guimarães |
author_facet |
Viana, Luiz Alberto Guimarães |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Fernandes Júnior, Antônio Carlos Lopes |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2586671440653430 |
dc.contributor.advisor2Lattes.fl_str_mv |
http://lattes.cnpq.br/6012321412801915 |
dc.contributor.advisor-co1.fl_str_mv |
Simas Filho, Eduardo Furtado de |
dc.contributor.referee1.fl_str_mv |
Fernandes Júnior, Antônio Carlos Lopes |
dc.contributor.referee2.fl_str_mv |
Simas Filho, Eduardo Furtado de |
dc.contributor.referee3.fl_str_mv |
Montalvão Filho, Jugurta Rosa |
dc.contributor.referee4.fl_str_mv |
Prates, Ricardo Menezes |
dc.contributor.referee5.fl_str_mv |
Attux, Romis Ribeiro de Fassoil |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4552555694780012 |
dc.contributor.author.fl_str_mv |
Viana, Luiz Alberto Guimarães |
contributor_str_mv |
Fernandes Júnior, Antônio Carlos Lopes Simas Filho, Eduardo Furtado de Fernandes Júnior, Antônio Carlos Lopes Simas Filho, Eduardo Furtado de Montalvão Filho, Jugurta Rosa Prates, Ricardo Menezes Attux, Romis Ribeiro de Fassoil |
dc.subject.cnpq.fl_str_mv |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
topic |
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Andamento musical Wavelet Escalograma Rede neural convolucional Aumento artificial de dados Audio tempo estimation Musical tempo Wavelet Scalogram Convolutional neural networks Data augmentation Musical information retrieval (MIR) |
dc.subject.por.fl_str_mv |
Andamento musical Wavelet Escalograma Rede neural convolucional Aumento artificial de dados |
dc.subject.other.pt_BR.fl_str_mv |
Audio tempo estimation Musical tempo Wavelet Scalogram Convolutional neural networks Data augmentation Musical information retrieval (MIR) |
description |
A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-04-24T11:26:59Z |
dc.date.available.fl_str_mv |
2023-04-24T11:26:59Z |
dc.date.issued.fl_str_mv |
2023-02-13 |
dc.type.driver.fl_str_mv |
Mestrado Acadêmico info:eu-repo/semantics/masterThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufba.br/handle/ri/36909 |
identifier_str_mv |
VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023. |
url |
https://repositorio.ufba.br/handle/ri/36909 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.publisher.program.fl_str_mv |
Departamento de Engenharia Elétrica (DEEC) |
dc.publisher.initials.fl_str_mv |
UFBA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Universidade Federal da Bahia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFBA instname:Universidade Federal da Bahia (UFBA) instacron:UFBA |
instname_str |
Universidade Federal da Bahia (UFBA) |
instacron_str |
UFBA |
institution |
UFBA |
reponame_str |
Repositório Institucional da UFBA |
collection |
Repositório Institucional da UFBA |
bitstream.url.fl_str_mv |
https://repositorio.ufba.br/bitstream/ri/36909/5/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf.txt https://repositorio.ufba.br/bitstream/ri/36909/2/Disserta%c3%a7%c3%a3o%20Mestrado%20-%20Viana%2c%20L.A.G.%20-%20Estimativa%20de%20Andamento%20Musical.pdf https://repositorio.ufba.br/bitstream/ri/36909/3/license_rdf https://repositorio.ufba.br/bitstream/ri/36909/4/license.txt |
bitstream.checksum.fl_str_mv |
640d1e63623319ca444c7bdb872a0961 0a91ab96ae54d6ee7bfff01ed502d351 4d2950bda3d176f570a9f8b328dfbbef 67bf4f75790b0d8d38d8f112a48ad90b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA) |
repository.mail.fl_str_mv |
|
_version_ |
1808459661944291328 |