Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina

Detalhes bibliográficos
Autor(a) principal: Mafra, Gustavo Sena
Data de Publicação: 2016
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/xmlui/handle/123456789/171580
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
id UFSC_4852d61a499346757e41178e46c82732
oai_identifier_str oai:repositorio.ufsc.br:123456789/171580
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaMafra, Gustavo SenaCoutinho, DanielDuong, Quang-Khanh-Ngoc2016-12-15T14:30:44Z2016-12-15T14:30:44Z2016-12-15https://repositorio.ufsc.br/xmlui/handle/123456789/171580TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.O relatório apresentado aqui é o resultado de um trabalho realizado entre 23 de Março de 2015 e 5 de Setembro de 2015 para a validação do estágio de final de curso, parte do curso de engenharia oferecido pela escola francesa Supélec e pelo Master Recherche (M2R) ATSI (Automatique et traitement du signal et des images), oferecido conjuntamente pela Supélec, pela Université Paris-Sud 11 e pela ENS Cachan. Posteriormente, foi reutilizado como Projeto de Fim de Curso para o curso de Engenharia de Controle e Automação na UFSC (Universidade Federal de Santa Catarina). Technicolor é uma empresa francesa, baseada em Issy-les-Moulineaux (arredores de Paris), antigamente conhecida como Thomson Inc. e Thomson Multimedia. Ela foi renomeada em 2010 para o nome de sua subsidiária americana. Os serviços/fontes de receita principais de Technicolor são serviços de entretenimento (para as indústrias do cinema e da televisão), as sua divisão Connected Home (responsável por set-top boxes, modems, dispositivos residenciais conectados) e patenteamento de tecnologias, este trabalho sendo relevante para os últimos dois. O tema do estágio foi reconhecimento automático de cenas acústicas. Isto é, usar informações acústicas (sinais de audio) para inferir sobre o contexto dessa informação. Essa é uma forma particular de classificação de áudio, onde mais genericamente uma gravação de áudio é classificada em alguns rótulos pré-definidos. Exemplos de contextos/ambientes são ônibus, escritório, rua, etc. O estágio serviu como uma revisão e ponto de entrada para pesquisa em classificação de audio na Technicolor. Um workflow completo foi implementado e uma grande variedade de métodos foram testados, com o objetivo de avaliar o potencial de diferentes features acústicas, métodos e estratégias de classificação, e abordagens gerais em aprendizagem de máquina.The report presented here is the result of a work realized between the 23 March 2015 and 04 September 2015 for the validation of the end-of-studies internship that is part of the engineering course of Supélec and for the Master Recherche (M2R) ATSI (Automatique et traitement du signal et des images) offered jointly by Supélec, Université Paris-Sud 11 and ENS Cachan. Posteriorly, it was also used as the final project of the Control and Automation Engineering course offered by UFSC (Universidade Federal de Santa Catarina). Technicolor is a French company based in Issy-les-Moulineaux and previously known as Thomson Inc. and Thomson Multimedia. It rebranded itself in 2010 after its American film subsidiary. The main services/revenues of the company are entertainement services (for the film and television industries), its Connected Home activity (set-top boxes, modems, connected devices) and technology licensing, the work presented here being relevant to the last two. The subject of the internship was Acoustic scene recognition. It consists in using acoustic information (audio signals) to infer the context of this information. It is a particular form of audio classification in which more generally an audio recording is classified in some predefined labels. Examples of such environments are bus, office, street, etc. The internship served as a review and an entry point for research in Audio Classification at Technicolor. A complete workflow was implemented and a large variety of methods was tested, hoping to evaluate the potential of different audio features, classification methods and strategies and general machine learning approaches.78 f.Florianópolis, SC.Aprendizagem de máquina;Processamento de sinais;Redes neurais;Classificação de áudio.Machine learning;Signal processing;Neural networks;Audio classification.Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisengreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPFC_2016-1 Gustavo_Sena_Mafra.pdfPFC_2016-1 Gustavo_Sena_Mafra.pdfapplication/pdf877041https://repositorio.ufsc.br/bitstream/123456789/171580/1/PFC_2016-1%20Gustavo_Sena_Mafra.pdf4c8a873980b8967fe0d1de1e9d562486MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81383https://repositorio.ufsc.br/bitstream/123456789/171580/2/license.txt11ee89cd31d893362820eab7c4d46734MD52123456789/1715802016-12-15 12:30:44.28oai:repositorio.ufsc.br:123456789/171580Vm9jw6ogdGVtIGEgbGliZXJkYWRlIGRlOiBDb21wYXJ0aWxoYXIg4oCUIGNvcGlhciwgZGlzdHJpYnVpciBlIHRyYW5zbWl0aXIgYSBvYnJhLiBSZW1peGFyIOKAlCBjcmlhciBvYnJhcyBkZXJpdmFkYXMuClNvYiBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6IEF0cmlidWnDp8OjbyDigJQgVm9jw6ogZGV2ZSBjcmVkaXRhciBhIG9icmEgZGEgZm9ybWEgZXNwZWNpZmljYWRhIHBlbG8gYXV0b3Igb3UgbGljZW5jaWFudGUgKG1hcyBuw6NvIGRlIG1hbmVpcmEgcXVlIHN1Z2lyYSBxdWUgZXN0ZXMgY29uY2VkZW0gcXVhbHF1ZXIgYXZhbCBhIHZvY8OqIG91IGFvIHNldSB1c28gZGEgb2JyYSkuIFVzbyBuw6NvLWNvbWVyY2lhbCDigJQgVm9jw6ogbsOjbyBwb2RlIHVzYXIgZXN0YSBvYnJhIHBhcmEgZmlucyBjb21lcmNpYWlzLgpGaWNhbmRvIGNsYXJvIHF1ZTogUmVuw7puY2lhIOKAlCBRdWFscXVlciBkYXMgY29uZGnDp8O1ZXMgYWNpbWEgcG9kZSBzZXIgcmVudW5jaWFkYSBzZSB2b2PDqiBvYnRpdmVyIHBlcm1pc3PDo28gZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMuIERvbcOtbmlvIFDDumJsaWNvIOKAlCBPbmRlIGEgb2JyYSBvdSBxdWFscXVlciBkZSBzZXVzIGVsZW1lbnRvcyBlc3RpdmVyIGVtIGRvbcOtbmlvIHDDumJsaWNvIHNvYiBvIGRpcmVpdG8gYXBsaWPDoXZlbCwgZXN0YSBjb25kacOnw6NvIG7Do28gw6ksIGRlIG1hbmVpcmEgYWxndW1hLCBhZmV0YWRhIHBlbGEgbGljZW7Dp2EuIE91dHJvcyBEaXJlaXRvcyDigJQgT3Mgc2VndWludGVzIGRpcmVpdG9zIG7Do28gc8OjbywgZGUgbWFuZWlyYSBhbGd1bWEsIGFmZXRhZG9zIHBlbGEgbGljZW7Dp2E6IExpbWl0YcOnw7VlcyBlIGV4Y2XDp8O1ZXMgYW9zIGRpcmVpdG9zIGF1dG9yYWlzIG91IHF1YWlzcXVlciB1c29zIGxpdnJlcyBhcGxpY8OhdmVpczsgT3MgZGlyZWl0b3MgbW9yYWlzIGRvIGF1dG9yOyBEaXJlaXRvcyBxdWUgb3V0cmFzIHBlc3NvYXMgcG9kZW0gdGVyIHNvYnJlIGEgb2JyYSBvdSBzb2JyZSBhIHV0aWxpemHDp8OjbyBkYSBvYnJhLCB0YWlzIGNvbW8gZGlyZWl0b3MgZGUgaW1hZ2VtIG91IHByaXZhY2lkYWRlLiBBdmlzbyDigJQgUGFyYSBxdWFscXVlciByZXV0aWxpemHDp8OjbyBvdSBkaXN0cmlidWnDp8Ojbywgdm9jw6ogZGV2ZSBkZWl4YXIgY2xhcm8gYSB0ZXJjZWlyb3Mgb3MgdGVybW9zIGRhIGxpY2Vuw6dhIGEgcXVlIHNlIGVuY29udHJhIHN1Ym1ldGlkYSBlc3RhIG9icmEuIEEgbWVsaG9yIG1hbmVpcmEgZGUgZmF6ZXIgaXNzbyDDqSBjb20gdW0gbGluayBwYXJhIGVzdGEgcMOhZ2luYS4KTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyAtIGh0dHA6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLzMuMC9ici8KRepositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732016-12-15T14:30:44Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.pt_BR.fl_str_mv Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
title Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
spellingShingle Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
Mafra, Gustavo Sena
Aprendizagem de máquina;Processamento de sinais;Redes neurais;Classificação de áudio.
Machine learning;Signal processing;Neural networks;Audio classification.
title_short Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
title_full Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
title_fullStr Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
title_full_unstemmed Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
title_sort Reconhecimento automático de cenas acústicas com técnicas de aprendizagem de máquina
author Mafra, Gustavo Sena
author_facet Mafra, Gustavo Sena
author_role author
dc.contributor.pt_BR.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Mafra, Gustavo Sena
dc.contributor.advisor1.fl_str_mv Coutinho, Daniel
dc.contributor.advisor-co1.fl_str_mv Duong, Quang-Khanh-Ngoc
contributor_str_mv Coutinho, Daniel
Duong, Quang-Khanh-Ngoc
dc.subject.por.fl_str_mv Aprendizagem de máquina;Processamento de sinais;Redes neurais;Classificação de áudio.
Machine learning;Signal processing;Neural networks;Audio classification.
topic Aprendizagem de máquina;Processamento de sinais;Redes neurais;Classificação de áudio.
Machine learning;Signal processing;Neural networks;Audio classification.
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Engenharia de Controle e Automação.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-12-15T14:30:44Z
dc.date.available.fl_str_mv 2016-12-15T14:30:44Z
dc.date.issued.fl_str_mv 2016-12-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/xmlui/handle/123456789/171580
url https://repositorio.ufsc.br/xmlui/handle/123456789/171580
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 78 f.
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/171580/1/PFC_2016-1%20Gustavo_Sena_Mafra.pdf
https://repositorio.ufsc.br/bitstream/123456789/171580/2/license.txt
bitstream.checksum.fl_str_mv 4c8a873980b8967fe0d1de1e9d562486
11ee89cd31d893362820eab7c4d46734
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805101899415552