Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores

Detalhes bibliográficos
Autor(a) principal: Costa, Yandre Maldonado e Gomes da
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/34886
Resumo: Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores.
id UFPR_cdd09eee2de0d8b849324ddff4658d03
oai_identifier_str oai:acervodigital.ufpr.br:1884/34886
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Costa, Yandre Maldonado e Gomes daOliveira, Luiz Eduardo Soares de, 1971-Koerich, Alessandro LameirasUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática2014-03-19T18:18:51Z2014-03-19T18:18:51Z2013http://hdl.handle.net/1884/34886Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores.application/pdfMusica - Analise, apreciaçãoSistemas de reconhecimento de padrõesReconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - YANDRE MALDONADO E GOMES DA COSTA.pdfapplication/pdf7710769https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdfaba90d96de09a4fb8b2fadc977770043MD51open accessTEXTR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.txtR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.txtExtracted Texttext/plain290686https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txtcf333afbca59585b4ca6f5c099997221MD52open accessTHUMBNAILR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.jpgR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.jpgGenerated Thumbnailimage/jpeg1276https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg580c916b2218980180dddd0b204d61a5MD53open access1884/348862016-04-07 04:44:44.952open accessoai:acervodigital.ufpr.br:1884/34886Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T07:44:44Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
spellingShingle Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
Costa, Yandre Maldonado e Gomes da
Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
title_short Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_full Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_fullStr Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_full_unstemmed Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_sort Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
author Costa, Yandre Maldonado e Gomes da
author_facet Costa, Yandre Maldonado e Gomes da
author_role author
dc.contributor.other.pt_BR.fl_str_mv Oliveira, Luiz Eduardo Soares de, 1971-
Koerich, Alessandro Lameiras
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Costa, Yandre Maldonado e Gomes da
dc.subject.por.fl_str_mv Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
topic Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
description Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores.
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2014-03-19T18:18:51Z
dc.date.available.fl_str_mv 2014-03-19T18:18:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/34886
url http://hdl.handle.net/1884/34886
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf
https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg
bitstream.checksum.fl_str_mv aba90d96de09a4fb8b2fadc977770043
cf333afbca59585b4ca6f5c099997221
580c916b2218980180dddd0b204d61a5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860794926759936