Classificação automática de cenas acústicas usando algoritmos de clusterização

Detalhes bibliográficos
Autor(a) principal: Santos, Carlos Alexandre Peron dos
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6002
Resumo: O problema de Classificação de Cenas Acústicas consiste em atribuir um rótulo de ambiente a um sinal de áudio. Entre os rótulos estão parques, aeroportos, ruas e praças públicas, por exemplo. Neste trabalho são propostas quatro abordagens baseadas em aprendizagem de máquina e processamento de sinais para este problema. O objetivo principal é minimizar o custo computacional necessário para treinar os modelos e realizar predições, mantendo o desempenho da classificação em níveis aceitáveis. O principal método utilizado consiste em descrever os áudios com Mel-Frequency Cepstral Coefficients e depois agrupá-los com uma abordagem baseada em K-means em 2 níveis. Este agrupamento descreve as classes utilizando os sons comuns entre os áudios de cada classe, promovendo generalização e diminuindo a quantidade de dados necessária para geração do modelo, o que diminui o custo computacional do sistema. Esta abordagem reduziu a quantidade de dados necessários para o treinamento para pouco menos de 10% do total e obteve acurácia de 62% na base de dados DCASE 2018 Task 1a. Este resultado é comparável com os resultados obtidos no sistema baseline, que utiliza Redes Neurais Convolucionais.
id UTFPR-12_1fab8cc0f1731d417f29b04ba1abd6bf
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6002
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-09T19:10:09Z2020-11-09T19:10:09Z2019-11-27SANTOS, Carlos Alexandre Peron dos. Classificação automática de cenas acústicas usando algoritmos de clusterização. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/6002O problema de Classificação de Cenas Acústicas consiste em atribuir um rótulo de ambiente a um sinal de áudio. Entre os rótulos estão parques, aeroportos, ruas e praças públicas, por exemplo. Neste trabalho são propostas quatro abordagens baseadas em aprendizagem de máquina e processamento de sinais para este problema. O objetivo principal é minimizar o custo computacional necessário para treinar os modelos e realizar predições, mantendo o desempenho da classificação em níveis aceitáveis. O principal método utilizado consiste em descrever os áudios com Mel-Frequency Cepstral Coefficients e depois agrupá-los com uma abordagem baseada em K-means em 2 níveis. Este agrupamento descreve as classes utilizando os sons comuns entre os áudios de cada classe, promovendo generalização e diminuindo a quantidade de dados necessária para geração do modelo, o que diminui o custo computacional do sistema. Esta abordagem reduziu a quantidade de dados necessários para o treinamento para pouco menos de 10% do total e obteve acurácia de 62% na base de dados DCASE 2018 Task 1a. Este resultado é comparável com os resultados obtidos no sistema baseline, que utiliza Redes Neurais Convolucionais.The Acoustic Scene Classification problem deals with assigning an environment-related label to an audio signal. Among the labels are parks, airports, streets and public squares. In this work we present four approaches to this problem based on machine learning and digital signal processing. Our main objective was to minimize the computing power required for model training and making predictions, while keeping classification performance at acceptable levels. Our highest performing method consists in describing audios with Mel-Frequency Cepstral Coefficients and then grouping them with a 2-level K-means clustering approach. This clustering approach describes classes using sounds that are common among audios of the same class. This promotes generalization and lowers the number of data points needed for model training. In turn, this lowers the system computing power requirements. This approach reduced the number of data points to around 10% of the total, and achieved 62% accuracy in the DCASE 2018 Task 1a dataset. This result is comparable with the results obtained by the baseline system, which is based on convolutional neural networks.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado do computadorProcessamento de sinaisFourier, Transformadas deMachine learningSignal processingFourier transformationsClassificação automática de cenas acústicas usando algoritmos de clusterizaçãoAutomatic acoustic scenes classification using clustering algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoFoleiss, Juliano HenriqueFoleiss, Juliano HenriqueCampiolo, RodrigoGonçalves, Rogério AparecidoSantos, Carlos Alexandre Peron dosinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALclassificacaoautomaticacenasacusticas.pdfapplication/pdf1568058http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/1/classificacaoautomaticacenasacusticas.pdf46b4bac601c5f5606b1b6f4d32bc2fc2MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTclassificacaoautomaticacenasacusticas.pdf.txtExtracted texttext/plain74047http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/3/classificacaoautomaticacenasacusticas.pdf.txtcce7fd6e8f3d688196ba99bdf8f0e262MD53THUMBNAILclassificacaoautomaticacenasacusticas.pdf.jpgGenerated Thumbnailimage/jpeg1342http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/4/classificacaoautomaticacenasacusticas.pdf.jpge27843058e3d39a8b7e25c63b20262ceMD541/60022020-11-09 17:10:09.314oai:repositorio.utfpr.edu.br:1/6002TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:09Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Classificação automática de cenas acústicas usando algoritmos de clusterização
dc.title.alternative.pt_BR.fl_str_mv Automatic acoustic scenes classification using clustering algorithms
title Classificação automática de cenas acústicas usando algoritmos de clusterização
spellingShingle Classificação automática de cenas acústicas usando algoritmos de clusterização
Santos, Carlos Alexandre Peron dos
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado do computador
Processamento de sinais
Fourier, Transformadas de
Machine learning
Signal processing
Fourier transformations
title_short Classificação automática de cenas acústicas usando algoritmos de clusterização
title_full Classificação automática de cenas acústicas usando algoritmos de clusterização
title_fullStr Classificação automática de cenas acústicas usando algoritmos de clusterização
title_full_unstemmed Classificação automática de cenas acústicas usando algoritmos de clusterização
title_sort Classificação automática de cenas acústicas usando algoritmos de clusterização
author Santos, Carlos Alexandre Peron dos
author_facet Santos, Carlos Alexandre Peron dos
author_role author
dc.contributor.advisor1.fl_str_mv Foleiss, Juliano Henrique
dc.contributor.referee1.fl_str_mv Foleiss, Juliano Henrique
dc.contributor.referee2.fl_str_mv Campiolo, Rodrigo
dc.contributor.referee3.fl_str_mv Gonçalves, Rogério Aparecido
dc.contributor.author.fl_str_mv Santos, Carlos Alexandre Peron dos
contributor_str_mv Foleiss, Juliano Henrique
Foleiss, Juliano Henrique
Campiolo, Rodrigo
Gonçalves, Rogério Aparecido
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado do computador
Processamento de sinais
Fourier, Transformadas de
Machine learning
Signal processing
Fourier transformations
dc.subject.por.fl_str_mv Aprendizado do computador
Processamento de sinais
Fourier, Transformadas de
Machine learning
Signal processing
Fourier transformations
description O problema de Classificação de Cenas Acústicas consiste em atribuir um rótulo de ambiente a um sinal de áudio. Entre os rótulos estão parques, aeroportos, ruas e praças públicas, por exemplo. Neste trabalho são propostas quatro abordagens baseadas em aprendizagem de máquina e processamento de sinais para este problema. O objetivo principal é minimizar o custo computacional necessário para treinar os modelos e realizar predições, mantendo o desempenho da classificação em níveis aceitáveis. O principal método utilizado consiste em descrever os áudios com Mel-Frequency Cepstral Coefficients e depois agrupá-los com uma abordagem baseada em K-means em 2 níveis. Este agrupamento descreve as classes utilizando os sons comuns entre os áudios de cada classe, promovendo generalização e diminuindo a quantidade de dados necessária para geração do modelo, o que diminui o custo computacional do sistema. Esta abordagem reduziu a quantidade de dados necessários para o treinamento para pouco menos de 10% do total e obteve acurácia de 62% na base de dados DCASE 2018 Task 1a. Este resultado é comparável com os resultados obtidos no sistema baseline, que utiliza Redes Neurais Convolucionais.
publishDate 2019
dc.date.issued.fl_str_mv 2019-11-27
dc.date.accessioned.fl_str_mv 2020-11-09T19:10:09Z
dc.date.available.fl_str_mv 2020-11-09T19:10:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Carlos Alexandre Peron dos. Classificação automática de cenas acústicas usando algoritmos de clusterização. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/6002
identifier_str_mv SANTOS, Carlos Alexandre Peron dos. Classificação automática de cenas acústicas usando algoritmos de clusterização. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6002
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Computação
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/1/classificacaoautomaticacenasacusticas.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/3/classificacaoautomaticacenasacusticas.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6002/4/classificacaoautomaticacenasacusticas.pdf.jpg
bitstream.checksum.fl_str_mv 46b4bac601c5f5606b1b6f4d32bc2fc2
b9d82215ab23456fa2d8b49c5df1b95b
cce7fd6e8f3d688196ba99bdf8f0e262
e27843058e3d39a8b7e25c63b20262ce
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923084001083392