Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado

Detalhes bibliográficos
Autor(a) principal: Silva, Micael Valterlânio da
Data de Publicação: 2024
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/19314
Resumo: Organizing and retrieving musical information automatically is a highly demanded activity. Labeling music with information that succinctly describes it has implications for these and other related tasks. One of the most widely used approaches to label musical recordings is through genre information. However, this task is quite challenging. In recent years, the literature has shown significant progress in this task by applying machine learning algorithms based on deep neural networks (DNN). In this scenario, the commonly adopted practice is to use time-frequency visual representations of audio as input for a DNN. Therefore, the aim of this work is to perform a comparative analysis between the impact of using various visual representations of music, such as Spectrogram, Mel-spectrogram, Chromagram, Tempogram, and Tonnetz, obtained from its audio, and transfer learning in genre classification through DNNs. This research will present the foundational knowledge and acquired results, as well as an analysis of the outcomes. This analysis aims to understand the processes that contributed to the transfer learning approach outperforming the use of various visual representations in achieving better and more consistent results.
id SCAR_85babd83da3d7ca778670ec6fcb8af18
oai_identifier_str oai:repositorio.ufscar.br:ufscar/19314
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Silva, Micael Valterlânio daValejo, Alan Demétrius Bariahttp://lattes.cnpq.br/95461647901898302024-02-16T11:48:50Z2024-02-16T11:48:50Z2024-01-31SILVA, Micael Valterlânio da. Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado. 2024. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19314.https://repositorio.ufscar.br/handle/ufscar/19314Organizing and retrieving musical information automatically is a highly demanded activity. Labeling music with information that succinctly describes it has implications for these and other related tasks. One of the most widely used approaches to label musical recordings is through genre information. However, this task is quite challenging. In recent years, the literature has shown significant progress in this task by applying machine learning algorithms based on deep neural networks (DNN). In this scenario, the commonly adopted practice is to use time-frequency visual representations of audio as input for a DNN. Therefore, the aim of this work is to perform a comparative analysis between the impact of using various visual representations of music, such as Spectrogram, Mel-spectrogram, Chromagram, Tempogram, and Tonnetz, obtained from its audio, and transfer learning in genre classification through DNNs. This research will present the foundational knowledge and acquired results, as well as an analysis of the outcomes. This analysis aims to understand the processes that contributed to the transfer learning approach outperforming the use of various visual representations in achieving better and more consistent results.Organizar e recuperar informação musical automaticamente é uma atividade altamente requerida. Rotular músicas com informações que a descrevam de modo sucinto possui implicações nessas e em outras tarefas relacionadas. Uma das abordagens mais utilizadas para se rotular gravações musicais é por meio da informação de gênero. No entanto, esta tarefa é bastante difícil. Nos últimos anos, a literatura tem mostrado um avanço significativo nessa tarefa ao se aplicar algoritmos de aprendizado de máquina baseados em redes neurais profundas (RNPs). Nesse cenário, a prática comumente adotada é utilizar representações visuais de tempo-frequência do áudio como entrada para uma RNP. Diante disso, o objetivo deste trabalho é realizar uma análise comparativa entre o impacto da utilização de variadas representações visuais de música como, Espectrograma, Mel-espectrograma, Cromagrama, Tempograma e Tonnetz, obtidas a partir de seu áudio, e a transferência de aprendizado na classificação de gêneros por meio de RNPs. Serão apresentados os conhecimentos que embasam toda a pesquisa e os resultados obtidos, bem como uma análise dos resultados, para que seja possível compreender os processos que levaram a abordagem utilizando transferência de aprendizado ter resultados melhores e mais consistentes com relação a abordagem utilizando diferentes representações visuais.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosEngenharia de Computação - ECUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAprendizado da máquinaRedes neurais profundasTransferência de aprendizadoRepresentações visuais de áudiosCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOAnálise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizadoComparative analysis between musical genre classification algorithms based on different visual representations and transfer learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL2023_TCC_Micael_Valterlanio_da_Silva.pdf2023_TCC_Micael_Valterlanio_da_Silva.pdfTCC Micael Valterlanio da Silvaapplication/pdf16204021https://repositorio.ufscar.br/bitstream/ufscar/19314/1/2023_TCC_Micael_Valterlanio_da_Silva.pdffb1a38ef55a806a965c4bc97b48bb71cMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstream/ufscar/19314/2/license_rdff337d95da1fce0a22c77480e5e9a7aecMD52TEXT2023_TCC_Micael_Valterlanio_da_Silva.pdf.txt2023_TCC_Micael_Valterlanio_da_Silva.pdf.txtExtracted texttext/plain80454https://repositorio.ufscar.br/bitstream/ufscar/19314/3/2023_TCC_Micael_Valterlanio_da_Silva.pdf.txt2b1936b6110448e24fa4210d36259a7aMD53ufscar/193142024-05-14 17:31:56.997oai:repositorio.ufscar.br:ufscar/19314Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222024-05-14T17:31:56Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
dc.title.alternative.eng.fl_str_mv Comparative analysis between musical genre classification algorithms based on different visual representations and transfer learning
title Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
spellingShingle Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
Silva, Micael Valterlânio da
Aprendizado da máquina
Redes neurais profundas
Transferência de aprendizado
Representações visuais de áudios
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
title_short Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
title_full Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
title_fullStr Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
title_full_unstemmed Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
title_sort Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado
author Silva, Micael Valterlânio da
author_facet Silva, Micael Valterlânio da
author_role author
dc.contributor.author.fl_str_mv Silva, Micael Valterlânio da
dc.contributor.advisor1.fl_str_mv Valejo, Alan Demétrius Baria
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9546164790189830
contributor_str_mv Valejo, Alan Demétrius Baria
dc.subject.por.fl_str_mv Aprendizado da máquina
Redes neurais profundas
Transferência de aprendizado
Representações visuais de áudios
topic Aprendizado da máquina
Redes neurais profundas
Transferência de aprendizado
Representações visuais de áudios
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description Organizing and retrieving musical information automatically is a highly demanded activity. Labeling music with information that succinctly describes it has implications for these and other related tasks. One of the most widely used approaches to label musical recordings is through genre information. However, this task is quite challenging. In recent years, the literature has shown significant progress in this task by applying machine learning algorithms based on deep neural networks (DNN). In this scenario, the commonly adopted practice is to use time-frequency visual representations of audio as input for a DNN. Therefore, the aim of this work is to perform a comparative analysis between the impact of using various visual representations of music, such as Spectrogram, Mel-spectrogram, Chromagram, Tempogram, and Tonnetz, obtained from its audio, and transfer learning in genre classification through DNNs. This research will present the foundational knowledge and acquired results, as well as an analysis of the outcomes. This analysis aims to understand the processes that contributed to the transfer learning approach outperforming the use of various visual representations in achieving better and more consistent results.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-02-16T11:48:50Z
dc.date.available.fl_str_mv 2024-02-16T11:48:50Z
dc.date.issued.fl_str_mv 2024-01-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Micael Valterlânio da. Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado. 2024. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19314.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/19314
identifier_str_mv SILVA, Micael Valterlânio da. Análise comparativa entre algoritmos de classificação de gênero musical baseados em diferentes representações visuais e transferência de aprendizado. 2024. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/ufscar/19314.
url https://repositorio.ufscar.br/handle/ufscar/19314
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Engenharia de Computação - EC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
Engenharia de Computação - EC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/19314/1/2023_TCC_Micael_Valterlanio_da_Silva.pdf
https://repositorio.ufscar.br/bitstream/ufscar/19314/2/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/19314/3/2023_TCC_Micael_Valterlanio_da_Silva.pdf.txt
bitstream.checksum.fl_str_mv fb1a38ef55a806a965c4bc97b48bb71c
f337d95da1fce0a22c77480e5e9a7aec
2b1936b6110448e24fa4210d36259a7a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136432150577152