Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/53274 |
Resumo: | O monitoramento de localização e de comportamento de animais em seu meio-ambiente é uma atividade de grande importância para o estudo dos seus hábitos e sua preservação. Porém, as técnicas de monitoramento de vida animal precisam ser o menos intrusivas possíveis. No caso de baleias, uma forma de monitoramento não-intrusivo é através da análise e classificação dos sons emitidos por elas. Porém, a classificação de sons de baleias não é uma atividade simples, pois os sinais captados por microfones sub-aquáticos (hidrofones) possuem muitos ruídos e sons de outros animais. Por outro lado, o uso de técnicas de Aprendizado Profundo (Deep Learning) para classificação de sons tem sido cada vez mais explorado em diferentes áreas, como reconhecimento de fala, detecção de anomalias em máquinas, segurança pública e monitoramento ambiental. Com a evolução dessas técnicas e o aumento da capacidade de processamento de dados, tornou-se possível treinar redes neurais profundas para identificar padrões complexos em dados de áudio e, assim, classificar sons com alta precisão, mesmo em ambientes onde há altos níveis de ruído de fundo. Neste contexto, o presente trabalho propõe uma abordagem para classificação de áudios de baleia baseada em técnicas de deep learning neural networks e de processamento digital de imagens em imagens de espectrogramas de sons captados por hidrofones. As etapas da abordagem proposta incluem a geração e o processamento dos espectrogramas de áudios utilizando-se técnicas de processamento digital de imagens e classificação de imagens de espectrogramas com sons de Baleias-francas-do-atlântico norte. A proposta foi validada utilizando-se sons reais de baleias e conseguiu-se obter resultados com acurácia superior a 93%. |
id |
UFRN_39344c978a5028fb5406a41950952a7c |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/53274 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Oliveira, Rafael Vinicius Renovato dehttp://lattes.cnpq.br/5805873373458189Silva, Ivanovitch Medeiros Dantas daGendriz, Ignacio SanchezOliveira, Luiz Affonso Henderson Guedes de2023-07-12T18:13:46Z2023-07-12T18:13:46Z2023-06-21OLIVEIRA, Rafael Vinicius Renovato de. Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem. Orientador: Luiz Affonso Henderson Guedes de Oliveira. 2023. 47f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.https://repositorio.ufrn.br/handle/123456789/53274O monitoramento de localização e de comportamento de animais em seu meio-ambiente é uma atividade de grande importância para o estudo dos seus hábitos e sua preservação. Porém, as técnicas de monitoramento de vida animal precisam ser o menos intrusivas possíveis. No caso de baleias, uma forma de monitoramento não-intrusivo é através da análise e classificação dos sons emitidos por elas. Porém, a classificação de sons de baleias não é uma atividade simples, pois os sinais captados por microfones sub-aquáticos (hidrofones) possuem muitos ruídos e sons de outros animais. Por outro lado, o uso de técnicas de Aprendizado Profundo (Deep Learning) para classificação de sons tem sido cada vez mais explorado em diferentes áreas, como reconhecimento de fala, detecção de anomalias em máquinas, segurança pública e monitoramento ambiental. Com a evolução dessas técnicas e o aumento da capacidade de processamento de dados, tornou-se possível treinar redes neurais profundas para identificar padrões complexos em dados de áudio e, assim, classificar sons com alta precisão, mesmo em ambientes onde há altos níveis de ruído de fundo. Neste contexto, o presente trabalho propõe uma abordagem para classificação de áudios de baleia baseada em técnicas de deep learning neural networks e de processamento digital de imagens em imagens de espectrogramas de sons captados por hidrofones. As etapas da abordagem proposta incluem a geração e o processamento dos espectrogramas de áudios utilizando-se técnicas de processamento digital de imagens e classificação de imagens de espectrogramas com sons de Baleias-francas-do-atlântico norte. A proposta foi validada utilizando-se sons reais de baleias e conseguiu-se obter resultados com acurácia superior a 93%.Monitoring the location and behavior of animals in their environment is of great importance for the study of their habits and their preservation. However, animal life monitoring techniques should be as less intrusive as possible. In the case of whales, one form of non-invasive monitoring is through the analysis and classification of the sounds emitted by them. However, classifying whale sounds is not a simple activity, as signals captured by underwater microphones (hydrophones) have a lot of noise and sounds from other animals. On the other hand, the use of deep learning techniques for sound classification has been increasingly explored in different areas, such as speech recognition, machine anomaly detection, public safety and environmental monitoring. With the evolution of these techniques and the increase in data processing capacity, it has become possible to train deep neural networks to identify complex patterns in audio data and thus classify sounds with high accuracy, even in environments where there are high levels of background noise. In this context, the present work proposes an approach to classification of whale audio based on techniques of deep-learning neural networks and image processing in images of spectrograms of sounds captured by hydrophones. The steps of the proposed approach include the generation and processing of audio spectrum using digital image processing techniques and classification of spectrum images with whale sounds. The proposal was validated using real whale sounds and results were obtained with accuracy of more than 93%.Universidade Federal do Rio Grande do NorteEngenharia de ComputaçãoUFRNBrasilEngenharia de Computação e AutomaçãoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAprendizado profundoClassificação de áudiosProcessamento digital de imagensDeep learningAudio classificationDigital image processingClassificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagemWhale audio classification based on deep learning and image processing techniquesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALTCC_RAFAEL_FINAL.pdfTCC_RAFAEL_FINAL.pdfmonografia_rafael_2023application/pdf2081755https://repositorio.ufrn.br/bitstream/123456789/53274/1/TCC_RAFAEL_FINAL.pdf13ddb37ddb0bdb4c93d05a98cdc76256MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufrn.br/bitstream/123456789/53274/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/53274/3/license.txte9597aa2854d128fd968be5edc8a28d9MD53123456789/532742023-07-12 15:13:46.953oai:https://repositorio.ufrn.br:123456789/53274Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-07-12T18:13:46Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
dc.title.alternative.pt_BR.fl_str_mv |
Whale audio classification based on deep learning and image processing techniques |
title |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
spellingShingle |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem Oliveira, Rafael Vinicius Renovato de Aprendizado profundo Classificação de áudios Processamento digital de imagens Deep learning Audio classification Digital image processing |
title_short |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
title_full |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
title_fullStr |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
title_full_unstemmed |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
title_sort |
Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem |
author |
Oliveira, Rafael Vinicius Renovato de |
author_facet |
Oliveira, Rafael Vinicius Renovato de |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5805873373458189 |
dc.contributor.referees1.none.fl_str_mv |
Silva, Ivanovitch Medeiros Dantas da |
dc.contributor.referees2.none.fl_str_mv |
Gendriz, Ignacio Sanchez |
dc.contributor.author.fl_str_mv |
Oliveira, Rafael Vinicius Renovato de |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de |
contributor_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de |
dc.subject.por.fl_str_mv |
Aprendizado profundo Classificação de áudios Processamento digital de imagens Deep learning Audio classification Digital image processing |
topic |
Aprendizado profundo Classificação de áudios Processamento digital de imagens Deep learning Audio classification Digital image processing |
description |
O monitoramento de localização e de comportamento de animais em seu meio-ambiente é uma atividade de grande importância para o estudo dos seus hábitos e sua preservação. Porém, as técnicas de monitoramento de vida animal precisam ser o menos intrusivas possíveis. No caso de baleias, uma forma de monitoramento não-intrusivo é através da análise e classificação dos sons emitidos por elas. Porém, a classificação de sons de baleias não é uma atividade simples, pois os sinais captados por microfones sub-aquáticos (hidrofones) possuem muitos ruídos e sons de outros animais. Por outro lado, o uso de técnicas de Aprendizado Profundo (Deep Learning) para classificação de sons tem sido cada vez mais explorado em diferentes áreas, como reconhecimento de fala, detecção de anomalias em máquinas, segurança pública e monitoramento ambiental. Com a evolução dessas técnicas e o aumento da capacidade de processamento de dados, tornou-se possível treinar redes neurais profundas para identificar padrões complexos em dados de áudio e, assim, classificar sons com alta precisão, mesmo em ambientes onde há altos níveis de ruído de fundo. Neste contexto, o presente trabalho propõe uma abordagem para classificação de áudios de baleia baseada em técnicas de deep learning neural networks e de processamento digital de imagens em imagens de espectrogramas de sons captados por hidrofones. As etapas da abordagem proposta incluem a geração e o processamento dos espectrogramas de áudios utilizando-se técnicas de processamento digital de imagens e classificação de imagens de espectrogramas com sons de Baleias-francas-do-atlântico norte. A proposta foi validada utilizando-se sons reais de baleias e conseguiu-se obter resultados com acurácia superior a 93%. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-07-12T18:13:46Z |
dc.date.available.fl_str_mv |
2023-07-12T18:13:46Z |
dc.date.issued.fl_str_mv |
2023-06-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OLIVEIRA, Rafael Vinicius Renovato de. Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem. Orientador: Luiz Affonso Henderson Guedes de Oliveira. 2023. 47f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/53274 |
identifier_str_mv |
OLIVEIRA, Rafael Vinicius Renovato de. Classificação de áudios de baleia baseada em técnicas de deep learning e processamento de imagem. Orientador: Luiz Affonso Henderson Guedes de Oliveira. 2023. 47f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. |
url |
https://repositorio.ufrn.br/handle/123456789/53274 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Engenharia de Computação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Engenharia de Computação e Automação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/53274/1/TCC_RAFAEL_FINAL.pdf https://repositorio.ufrn.br/bitstream/123456789/53274/2/license_rdf https://repositorio.ufrn.br/bitstream/123456789/53274/3/license.txt |
bitstream.checksum.fl_str_mv |
13ddb37ddb0bdb4c93d05a98cdc76256 e39d27027a6cc9cb039ad269a5db8e34 e9597aa2854d128fd968be5edc8a28d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832974389051392 |