Detecção de instrumentos musicais com redes neurais profundas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | https://app.uff.br/riuff/handle/1/5810 |
Resumo: | Abordamos nesse trabalho sobre como classificar um instrumento dominante em um trecho de música usando redes neurais convolucionais. Introduzimos alguns conceitos de processamento de sinais digitais, abordamos o funcionamento da Transformada de Fourier e sua utilização para geração de espectrogramas que são a entrada do nosso algoritmo. Introduzimos o conceito de aprendizado de máquina e discutimos sobre a evolução das redes neurais e algumas construções famosas utilizadas no trabalho. Apresentamos três redes famosas utilizadas para a classificação (LeNet, AlexNet e GoogLeNet) e suas devidas arquiteturas e tarefas originais. Confrontamos as redes treinadas com diferentes conjuntos de dados gerados a partir de espectrogramas variando os parâmetros de tempo (100ms e 500ms) e escala de cor da potência do espectrograma (escala de cinza e escala de cores). Apresentamos os testes mais relevantes e comentamos o comportamento de cada rede e exibimos alguns de seus resultados. Comentamos sobre as escolhas de outros trabalhos da literatura e por fim resumimos nossas conclusões e apontamos trabalhos futuros para melhoria dos resultados |
id |
UFF-2_27bff8af75fb659c91146f4794246fbe |
---|---|
oai_identifier_str |
oai:app.uff.br:1/5810 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Detecção de instrumentos musicais com redes neurais profundasAprendizado de máquinaRedes neuraisProcessamento de sinaisRede neuralProcessamento de sinaisAprendizado de máquinaInstrumentação musicalMachine learningNeural networksSignal processingAbordamos nesse trabalho sobre como classificar um instrumento dominante em um trecho de música usando redes neurais convolucionais. Introduzimos alguns conceitos de processamento de sinais digitais, abordamos o funcionamento da Transformada de Fourier e sua utilização para geração de espectrogramas que são a entrada do nosso algoritmo. Introduzimos o conceito de aprendizado de máquina e discutimos sobre a evolução das redes neurais e algumas construções famosas utilizadas no trabalho. Apresentamos três redes famosas utilizadas para a classificação (LeNet, AlexNet e GoogLeNet) e suas devidas arquiteturas e tarefas originais. Confrontamos as redes treinadas com diferentes conjuntos de dados gerados a partir de espectrogramas variando os parâmetros de tempo (100ms e 500ms) e escala de cor da potência do espectrograma (escala de cinza e escala de cores). Apresentamos os testes mais relevantes e comentamos o comportamento de cada rede e exibimos alguns de seus resultados. Comentamos sobre as escolhas de outros trabalhos da literatura e por fim resumimos nossas conclusões e apontamos trabalhos futuros para melhoria dos resultadosWe will approach this work on how to classify a dominant instrument in a piece of music using convolutional neural networks. We introduce some digital signal proces- sing concepts, we discuss the operation of the Fourier Transform and its use to generate spectrograms that are input to our algorithm. We introduce the concept of machine lear- ning and discuss the evolution of neural networks and some famous architectures used in the work. We present three famous networks used for classification (LeNet, AlexNet and GoogLeNet) and their original architectures and tasks. We compare the trained networks with different data sets generated from spectrograms by varying the time scale (100ms and 500ms) and color spectrogram power scale (gray scale and color scale). We present the most relevant tests and comment on the behavior of each network and show some of its results. We commented on the choices of other papers in the literature and finally summarized our conclusions and pointed out future work to improve resultsCarvalho, Aline Marins PaesKowada, Luis Antonio BrasilFerreira, Marcos de Oliveira LageSilva, Marcos Pedro Ferreira Leal2018-02-20T16:53:02Z2018-02-20T16:53:02Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://app.uff.br/riuff/handle/1/5810http://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2021-09-15T15:49:51Zoai:app.uff.br:1/5810Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202021-09-15T15:49:51Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Detecção de instrumentos musicais com redes neurais profundas |
title |
Detecção de instrumentos musicais com redes neurais profundas |
spellingShingle |
Detecção de instrumentos musicais com redes neurais profundas Silva, Marcos Pedro Ferreira Leal Aprendizado de máquina Redes neurais Processamento de sinais Rede neural Processamento de sinais Aprendizado de máquina Instrumentação musical Machine learning Neural networks Signal processing |
title_short |
Detecção de instrumentos musicais com redes neurais profundas |
title_full |
Detecção de instrumentos musicais com redes neurais profundas |
title_fullStr |
Detecção de instrumentos musicais com redes neurais profundas |
title_full_unstemmed |
Detecção de instrumentos musicais com redes neurais profundas |
title_sort |
Detecção de instrumentos musicais com redes neurais profundas |
author |
Silva, Marcos Pedro Ferreira Leal |
author_facet |
Silva, Marcos Pedro Ferreira Leal |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carvalho, Aline Marins Paes Kowada, Luis Antonio Brasil Ferreira, Marcos de Oliveira Lage |
dc.contributor.author.fl_str_mv |
Silva, Marcos Pedro Ferreira Leal |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Redes neurais Processamento de sinais Rede neural Processamento de sinais Aprendizado de máquina Instrumentação musical Machine learning Neural networks Signal processing |
topic |
Aprendizado de máquina Redes neurais Processamento de sinais Rede neural Processamento de sinais Aprendizado de máquina Instrumentação musical Machine learning Neural networks Signal processing |
description |
Abordamos nesse trabalho sobre como classificar um instrumento dominante em um trecho de música usando redes neurais convolucionais. Introduzimos alguns conceitos de processamento de sinais digitais, abordamos o funcionamento da Transformada de Fourier e sua utilização para geração de espectrogramas que são a entrada do nosso algoritmo. Introduzimos o conceito de aprendizado de máquina e discutimos sobre a evolução das redes neurais e algumas construções famosas utilizadas no trabalho. Apresentamos três redes famosas utilizadas para a classificação (LeNet, AlexNet e GoogLeNet) e suas devidas arquiteturas e tarefas originais. Confrontamos as redes treinadas com diferentes conjuntos de dados gerados a partir de espectrogramas variando os parâmetros de tempo (100ms e 500ms) e escala de cor da potência do espectrograma (escala de cinza e escala de cores). Apresentamos os testes mais relevantes e comentamos o comportamento de cada rede e exibimos alguns de seus resultados. Comentamos sobre as escolhas de outros trabalhos da literatura e por fim resumimos nossas conclusões e apontamos trabalhos futuros para melhoria dos resultados |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-02-20T16:53:02Z 2018-02-20T16:53:02Z 2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://app.uff.br/riuff/handle/1/5810 |
url |
https://app.uff.br/riuff/handle/1/5810 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1807838674503598080 |