Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade

Detalhes bibliográficos
Autor(a) principal: Zottesso, Rafael Henrique Dalegrave
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
Texto Completo: http://repositorio.uem.br:8080/jspui/handle/1/2528
Resumo: This work presents a proposal for bird species identification using spectrograms and dissimilarity approach, in a database with a high number of species. The database is composed by audio recordings pre-selected by the LifeClef 2015 Bird Task that can be easily found on Xeno-canto website. In this work, eight subsets of data were created from this database, in order to diversify the amount of species and the duration of the audio samples in our tests, selecting only bird songs and discarding the bird calls. All audio samples used were preprocessed to reduce the impact of noise, removing other sources of sounds, and to detect points of interest with greatest relevance. Then, to transform the audio samples in images, there was a task to generate spectrograms, which went through the zoning process in order to enhance local information from each region created. Three texture descriptors were used to perform feature extraction: Local Binary Pattern (LBP), Local Phase Quantization (LPQ) and Robust Local Binary Pattern (RLBP). In the model-dependent approach these features were directly classified. In the dissimilarity approach it was needed to compute dissimilarity vectors (positive and negative), to further apply the classification scheme. Both cases used a classification through the SVM, allowing the application of combination rules to reach a final decision. After a series of experiments, it was perceived that the dissimilarity approach presented superior results in relation to a model-dependent approach and the literature.
id UEM-10_e6747042de45148f0c6f9174745c4904
oai_identifier_str oai:localhost:1/2528
network_acronym_str UEM-10
network_name_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository_id_str
spelling Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridadeBird species identification using spectrograms and dissimilaritySistemas de reconhecimento de padrõesPássarosIdentificação de espécies de pássarosPadrões (informática)Sistemas de reconhecimentoEspectrogramasProcessamento de sinaisDissimilaridadeBrasil.Bird species identificationDissimilarityPattern recognitionSpectrogram and textureSignal processingBrazil.Ciências Exatas e da TerraCiência da ComputaçãoThis work presents a proposal for bird species identification using spectrograms and dissimilarity approach, in a database with a high number of species. The database is composed by audio recordings pre-selected by the LifeClef 2015 Bird Task that can be easily found on Xeno-canto website. In this work, eight subsets of data were created from this database, in order to diversify the amount of species and the duration of the audio samples in our tests, selecting only bird songs and discarding the bird calls. All audio samples used were preprocessed to reduce the impact of noise, removing other sources of sounds, and to detect points of interest with greatest relevance. Then, to transform the audio samples in images, there was a task to generate spectrograms, which went through the zoning process in order to enhance local information from each region created. Three texture descriptors were used to perform feature extraction: Local Binary Pattern (LBP), Local Phase Quantization (LPQ) and Robust Local Binary Pattern (RLBP). In the model-dependent approach these features were directly classified. In the dissimilarity approach it was needed to compute dissimilarity vectors (positive and negative), to further apply the classification scheme. Both cases used a classification through the SVM, allowing the application of combination rules to reach a final decision. After a series of experiments, it was perceived that the dissimilarity approach presented superior results in relation to a model-dependent approach and the literature.Este trabalho tem por finalidade apresentar uma proposta para a identificação de espécies de pássaros utilizando espectrogramas e a abordagem de dissimilaridade, em uma base de dados com alta quantidade de espécies (classes). A base de dados é composta por sinais de áudio disponibilizados pelo projeto Xeno-canto, pré-selecionados pelo LifeClef 2015 Bird Task. Para este trabalho, oito subconjuntos balanceados de dados foram criados a partir dessa base, a fim de variar a quantidade de espécies disponíveis e o tempo de duração dos sinais de áudio nos testes, selecionando somente vocalizações do tipo canto e descartando os chamados. Todos os sinais de áudio utilizados foram pré-processados para reduzir o impacto dos ruídos, removendo outras fontes de sons, e para detectar trechos de interesse que possuem maior relevância. Depois, para representar os sinais de áudio no domínio de imagens houve a geração de espectrogramas, que passaram pelo processo de zoneamento com o intuito de destacar informações específicas de cada região criada. Três descritores de textura foram utilizados para extrair características das regiões dos espectrogramas: Local Binary Pattern (LBP), Local Phase Quantization (LPQ) e Robust Local Binary Pattern (RLBP). Na abordagem dependente de modelo essas características foram diretamente classificadas. Na abordagem de dissimilaridade foi necessário computar os vetores de dissimilaridade (positivos e negativos), para então aplicar o esquema de classificação. Ambos os casos empregaram a classificação por meio do SVM, permitindo a aplicação de regras de combinação para se chegar às decisões finais. Depois de uma série de experimentos, percebeu-se que a abordagem de dissimilaridade apresentou resultados superiores em relação a abordagem dependente de modelo e a literatura.70 fUniversidade Estadual de MaringáBrasilDepartamento de InformáticaPrograma de Pós-Graduação em Ciência da ComputaçãoUEMMaringá, PRCentro de TecnologiaYandre Maldonado e Gomes da CostaDiego Bertolini Gonçalves - UEMValéria Delisandra Feltrim - PUCPRLuiz Eduardo Soares de Oliveira - UFPRZottesso, Rafael Henrique Dalegrave2018-04-10T20:12:21Z2018-04-10T20:12:21Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://repositorio.uem.br:8080/jspui/handle/1/2528porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)instname:Universidade Estadual de Maringá (UEM)instacron:UEM2018-10-18T19:18:46Zoai:localhost:1/2528Repositório InstitucionalPUBhttp://repositorio.uem.br:8080/oai/requestopendoar:2024-04-23T14:55:35.343689Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)false
dc.title.none.fl_str_mv Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
Bird species identification using spectrograms and dissimilarity
title Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
spellingShingle Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
Zottesso, Rafael Henrique Dalegrave
Sistemas de reconhecimento de padrões
Pássaros
Identificação de espécies de pássaros
Padrões (informática)
Sistemas de reconhecimento
Espectrogramas
Processamento de sinais
Dissimilaridade
Brasil.
Bird species identification
Dissimilarity
Pattern recognition
Spectrogram and texture
Signal processing
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
title_short Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
title_full Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
title_fullStr Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
title_full_unstemmed Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
title_sort Identificação de espécies de pássaros utilizando espectrogramas e dissimilaridade
author Zottesso, Rafael Henrique Dalegrave
author_facet Zottesso, Rafael Henrique Dalegrave
author_role author
dc.contributor.none.fl_str_mv Yandre Maldonado e Gomes da Costa
Diego Bertolini Gonçalves - UEM
Valéria Delisandra Feltrim - PUCPR
Luiz Eduardo Soares de Oliveira - UFPR
dc.contributor.author.fl_str_mv Zottesso, Rafael Henrique Dalegrave
dc.subject.por.fl_str_mv Sistemas de reconhecimento de padrões
Pássaros
Identificação de espécies de pássaros
Padrões (informática)
Sistemas de reconhecimento
Espectrogramas
Processamento de sinais
Dissimilaridade
Brasil.
Bird species identification
Dissimilarity
Pattern recognition
Spectrogram and texture
Signal processing
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
topic Sistemas de reconhecimento de padrões
Pássaros
Identificação de espécies de pássaros
Padrões (informática)
Sistemas de reconhecimento
Espectrogramas
Processamento de sinais
Dissimilaridade
Brasil.
Bird species identification
Dissimilarity
Pattern recognition
Spectrogram and texture
Signal processing
Brazil.
Ciências Exatas e da Terra
Ciência da Computação
description This work presents a proposal for bird species identification using spectrograms and dissimilarity approach, in a database with a high number of species. The database is composed by audio recordings pre-selected by the LifeClef 2015 Bird Task that can be easily found on Xeno-canto website. In this work, eight subsets of data were created from this database, in order to diversify the amount of species and the duration of the audio samples in our tests, selecting only bird songs and discarding the bird calls. All audio samples used were preprocessed to reduce the impact of noise, removing other sources of sounds, and to detect points of interest with greatest relevance. Then, to transform the audio samples in images, there was a task to generate spectrograms, which went through the zoning process in order to enhance local information from each region created. Three texture descriptors were used to perform feature extraction: Local Binary Pattern (LBP), Local Phase Quantization (LPQ) and Robust Local Binary Pattern (RLBP). In the model-dependent approach these features were directly classified. In the dissimilarity approach it was needed to compute dissimilarity vectors (positive and negative), to further apply the classification scheme. Both cases used a classification through the SVM, allowing the application of combination rules to reach a final decision. After a series of experiments, it was perceived that the dissimilarity approach presented superior results in relation to a model-dependent approach and the literature.
publishDate 2017
dc.date.none.fl_str_mv 2017
2018-04-10T20:12:21Z
2018-04-10T20:12:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.uem.br:8080/jspui/handle/1/2528
url http://repositorio.uem.br:8080/jspui/handle/1/2528
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Departamento de Informática
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Centro de Tecnologia
publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Departamento de Informática
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringá, PR
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
instname:Universidade Estadual de Maringá (UEM)
instacron:UEM
instname_str Universidade Estadual de Maringá (UEM)
instacron_str UEM
institution UEM
reponame_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
collection Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository.name.fl_str_mv Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)
repository.mail.fl_str_mv
_version_ 1801841398630055936