Detecção de atividade vocal utilizando recorrência
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFABC |
Texto Completo: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157 |
Resumo: | Orientador: Prof. Dr. Filipe Ieda Fazanaro |
id |
UFBC_1f7ad60eaafcd9f3ba37e3012ffa51b2 |
---|---|
oai_identifier_str |
oai:BDTD:109157 |
network_acronym_str |
UFBC |
network_name_str |
Repositório Institucional da UFABC |
repository_id_str |
|
spelling |
Detecção de atividade vocal utilizando recorrênciaQUANTIFICAÇÃO DE RECORRÊNCIA - ANÁLISEDETECÇÃO DE ATIVIDADE DE VOZMAPAS DE RECORRÊNCIARECURRENCE QUANTIFICATION ANALYSISVOICE ACTIVITY DETECTIONRECURRENCE PLOTSPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABCOrientador: Prof. Dr. Filipe Ieda FazanaroDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2018.A detecção de atividade de voz é um problema importante em muitas aplicações de fala/áudio, incluindo codificação e reconhecimento automático de fala; vários algoritmos foram propostos na literatura explorando diferentes métricas de sinais (como a energia do sinal). Neste trabalho, é apresentada uma metodologia alternativa para detecção de atividade vocal (VAD) de um discurso ou sinal de áudio com base nas informações fornecidas pelos gráficos de recorrência do sinal. O método proposto foi capaz de classificar corretamente sinais limpos e com baixos níveis de ruído, apresentando desempenho próximo ao algoritmo incluído no codec G.729, que é comumente usado em aplicativos de Voz sobre IP (VoIP).Voice activity detection is an important problem in many speech/audio applications, including coding and automatic speech recognition; several algorithms have been proposed in the literature to explore different signal metrics (such as signal energy). In this work, an alternative methodology for the Voice Activity Detection (VAD) of a discourse or audio signal is presented based on the information provided by the signals¿ recurrence plots. The proposed method was able to correctly classify clean signals and with low levels of noise, obtained performance similar to the algorithm included in the G.729 codec, which is commonly used in VoIP applications.Fazanaro, Filipe IedaNose Filho, KenjiTakahata, André KazuoPereira, Danilo Mendes Rodrigues2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf48 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157&midiaext=75662http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157&midiaext=75661Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=109157porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2022-03-21T13:31:56Zoai:BDTD:109157Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2022-03-21T13:31:56Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
dc.title.none.fl_str_mv |
Detecção de atividade vocal utilizando recorrência |
title |
Detecção de atividade vocal utilizando recorrência |
spellingShingle |
Detecção de atividade vocal utilizando recorrência Pereira, Danilo Mendes Rodrigues QUANTIFICAÇÃO DE RECORRÊNCIA - ANÁLISE DETECÇÃO DE ATIVIDADE DE VOZ MAPAS DE RECORRÊNCIA RECURRENCE QUANTIFICATION ANALYSIS VOICE ACTIVITY DETECTION RECURRENCE PLOTS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABC |
title_short |
Detecção de atividade vocal utilizando recorrência |
title_full |
Detecção de atividade vocal utilizando recorrência |
title_fullStr |
Detecção de atividade vocal utilizando recorrência |
title_full_unstemmed |
Detecção de atividade vocal utilizando recorrência |
title_sort |
Detecção de atividade vocal utilizando recorrência |
author |
Pereira, Danilo Mendes Rodrigues |
author_facet |
Pereira, Danilo Mendes Rodrigues |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fazanaro, Filipe Ieda Nose Filho, Kenji Takahata, André Kazuo |
dc.contributor.author.fl_str_mv |
Pereira, Danilo Mendes Rodrigues |
dc.subject.por.fl_str_mv |
QUANTIFICAÇÃO DE RECORRÊNCIA - ANÁLISE DETECÇÃO DE ATIVIDADE DE VOZ MAPAS DE RECORRÊNCIA RECURRENCE QUANTIFICATION ANALYSIS VOICE ACTIVITY DETECTION RECURRENCE PLOTS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABC |
topic |
QUANTIFICAÇÃO DE RECORRÊNCIA - ANÁLISE DETECÇÃO DE ATIVIDADE DE VOZ MAPAS DE RECORRÊNCIA RECURRENCE QUANTIFICATION ANALYSIS VOICE ACTIVITY DETECTION RECURRENCE PLOTS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABC |
description |
Orientador: Prof. Dr. Filipe Ieda Fazanaro |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157 |
url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157&midiaext=75662 http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=109157&midiaext=75661 Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=109157 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 48 f. : il. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
instname_str |
Universidade Federal do ABC (UFABC) |
instacron_str |
UFABC |
institution |
UFABC |
reponame_str |
Repositório Institucional da UFABC |
collection |
Repositório Institucional da UFABC |
repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
repository.mail.fl_str_mv |
|
_version_ |
1813263944655044608 |