Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | http://hdl.handle.net/1884/34886 |
Resumo: | Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores. |
id |
UFPR_cdd09eee2de0d8b849324ddff4658d03 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/34886 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Costa, Yandre Maldonado e Gomes daOliveira, Luiz Eduardo Soares de, 1971-Koerich, Alessandro LameirasUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática2014-03-19T18:18:51Z2014-03-19T18:18:51Z2013http://hdl.handle.net/1884/34886Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores.application/pdfMusica - Analise, apreciaçãoSistemas de reconhecimento de padrõesReconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - YANDRE MALDONADO E GOMES DA COSTA.pdfapplication/pdf7710769https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdfaba90d96de09a4fb8b2fadc977770043MD51open accessTEXTR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.txtR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.txtExtracted Texttext/plain290686https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txtcf333afbca59585b4ca6f5c099997221MD52open accessTHUMBNAILR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.jpgR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.jpgGenerated Thumbnailimage/jpeg1276https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg580c916b2218980180dddd0b204d61a5MD53open access1884/348862016-04-07 04:44:44.952open accessoai:acervodigital.ufpr.br:1884/34886Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T07:44:44Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
title |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
spellingShingle |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores Costa, Yandre Maldonado e Gomes da Musica - Analise, apreciação Sistemas de reconhecimento de padrões |
title_short |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
title_full |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
title_fullStr |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
title_full_unstemmed |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
title_sort |
Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores |
author |
Costa, Yandre Maldonado e Gomes da |
author_facet |
Costa, Yandre Maldonado e Gomes da |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Oliveira, Luiz Eduardo Soares de, 1971- Koerich, Alessandro Lameiras Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
dc.contributor.author.fl_str_mv |
Costa, Yandre Maldonado e Gomes da |
dc.subject.por.fl_str_mv |
Musica - Analise, apreciação Sistemas de reconhecimento de padrões |
topic |
Musica - Analise, apreciação Sistemas de reconhecimento de padrões |
description |
Resumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013 |
dc.date.accessioned.fl_str_mv |
2014-03-19T18:18:51Z |
dc.date.available.fl_str_mv |
2014-03-19T18:18:51Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1884/34886 |
url |
http://hdl.handle.net/1884/34886 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg |
bitstream.checksum.fl_str_mv |
aba90d96de09a4fb8b2fadc977770043 cf333afbca59585b4ca6f5c099997221 580c916b2218980180dddd0b204d61a5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1801860794926759936 |