Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/22993 http://dx.doi.org/10.26512/2016.12.D.22993 |
Resumo: | Dissertação (mestrado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. |
id |
UNB_819a356f7d825dfa78b68205bf064a8e |
---|---|
oai_identifier_str |
oai:repositorio2.unb.br:10482/22993 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Silva, Ronaldo Rodrigues daCosta, João Paulo Carvalho Lustosa da2017-03-22T16:52:27Z2017-03-22T16:52:27Z2017-03-222016-12-13SILVA, Ronaldo Rodrigues da. Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor. 2016. xiv, 61 f., il. Dissertação (Mestrado em Engenharia Elétrica) — Universidade de Brasília, Brasília, 2016.http://repositorio.unb.br/handle/10482/22993http://dx.doi.org/10.26512/2016.12.D.22993Dissertação (mestrado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016.Comparação forense de locutor (CFL) é utilizada como uma abordagem complementar na confirmação da autoria de um crime. A metodologia mais difundida mundialmente neste tipo de exame se baseia em análises perceptuais e acústicas. Uma das medidas acústicas mais utilizadas em CFL é a frequência fundamental (F0). O parâmetro acústico F0 é robusto em áudios de baixa qualidade e é independente do conteúdo das falas, o que o torna um parâmetro interessante de ser utilizado nas análises forenses. Além disso, o algoritmo de extração de F0 apresenta baixa complexidade computacional. Neste trabalho, propõe-se analisar o poder discriminante da medida de longo termo da frequência fundamental nomeada valor de base de F0, que em trabalhos recentes tem se mostrado menos sujeita a variações associadas ao conteúdo, ao estilo da fala, ao canal utilizado na gravação, além de exigir uma menor quantidade de material para obter uma medida estável em comparação a outras medidas de longo termo, como a média aritmética e o desvio padrão. Foi avaliado o ganho de poder discriminante ao combinar a medida do valor de base de F0 a outras medidas de longo termo de F0 usualmente utilizadas na área forense por meio de uma abordagem que aplica a estatística de densidade do núcleo de multivariáveis, do inglês Multivariate Kernel-Density (MVKD). Os testes foram realizados utilizando um corpus composto de gravações de áudios de falantes masculinos do português brasileiro contendo 60 segundos de produções vozeadas e obteve-se uma Taxa de Erro Igual, do inglês Equal Error Rate (EER)de 13 %, superando pesquisas recentes.Forensic Speaker Comparisons (FSC) are applied as a complementary approach to con rm the authorship of a crime. The methodology most used in FSC is based on perceptual and acoustic analysis. One of the most frequent measures in FSC is the fundamental frequency F0. The acoustic parameter F0 is robust in low audio quality regardless of the speech content, which is very important to the forensic area. Moreover, its algorithm has a low computational complexity. In this work, we propose to analyze the discriminatory power of the long-term fundamental frequency parameter named baseline of the F0. This parameter is more stable considering the speech content and style, the recording channel and needs less audio quantity to extract a reliable measure compared to other F0 parameters, as arithmetic mean and the standard deviation which are the most used parameters in the forensic area. The discriminant gain improvement obtained combining the baseline of the F0 and other long-term fundamental frequency measures was addressed using the statistics of the Multivariate Kernel-Density (MVKD). The experiments were done using a brasilian portuguese male recording corpus containing 60 seconds of voiced speech each sample. We show that our proposed approach achieves an Equal Error Rate (EER) of 13 % outperforming recent researches.Faculdade de Tecnologia (FT)Departamento de Engenharia Elétrica (FT ENE)Programa de Pós-Graduação em Engenharia ElétricaA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessAplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutorApplying base value of fundamental frequency via MVKD in forensic speaker comparisoninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisComparação forense de locutor (CFL)Gravações de áudioMultivariate Kernel-Density (MVKD)porreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2016_RonaldoRodriguesdaSilva.pdf2016_RonaldoRodriguesdaSilva.pdfapplication/pdf1507927http://repositorio2.unb.br/jspui/bitstream/10482/22993/1/2016_RonaldoRodriguesdaSilva.pdf9db7accbea588ec2c50174217c542007MD51open accessLICENSElicense.txtlicense.txttext/plain761http://repositorio2.unb.br/jspui/bitstream/10482/22993/2/license.txt6d393f7933dc9d9c06887925dcb9ecbfMD52open access10482/229932024-03-01 13:07:56.955open accessoai:repositorio2.unb.br:10482/22993TGljZW5zZSBncmFudGVkIGJ5IENhbWlsYSAgRHVhcnRlIChjYW1pbGFkaWFzQGJjZS51bmIuYnIpIG9uIDIwMTctMDEtMjBUMTU6MjE6MTNaIChHTVQpOgoKQSBjb25jZXNzw6NvIGRhIGxpY2Vuw6dhIGRlc3RlIGl0ZW0gcmVmZXJlLXNlIGFvIHRlcm1vIGRlIGF1dG9yaXphw6fDo28gaW1wcmVzc28gYXNzaW5hZG8gDQpwZWxvIGF1dG9yIGNvbSBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6DQoNCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYQ0KIGUgbyBJQklDVCBhIGRpc3BvbmliaWxpemFyIHBvciBtZWlvIGRvcyBzaXRlcyB3d3cuYmNlLnVuYi5iciwgd3d3LmliaWN0LmJyLA0KIGh0dHA6Ly9oZXJjdWxlcy52dGxzLmNvbS9jZ2ktYmluL25kbHRkL2NoYW1lbGVvbj9sbmc9cHQmc2tpbj1uZGx0ZCBzZW0gcmVzc2FyY2ltZW50byBkb3MgDQpkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBuwrogOTYxMC85OCwgbyB0ZXh0byBpbnRlZ3JhbCBkYSBvYnJhIGRpc3BvbmliaWxpemFkYSwNCiBjb25mb3JtZSBwZXJtaXNzw7VlcyBhc3NpbmFsYWRhcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgYSB0w610dWxvIGRlIA0KZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EgYnJhc2lsZWlyYSwgYSBwYXJ0aXIgZGVzdGEgZGF0YS4=Biblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2024-03-01T16:07:56Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.en.fl_str_mv |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
dc.title.alternative.en.fl_str_mv |
Applying base value of fundamental frequency via MVKD in forensic speaker comparison |
title |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
spellingShingle |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor Silva, Ronaldo Rodrigues da Comparação forense de locutor (CFL) Gravações de áudio Multivariate Kernel-Density (MVKD) |
title_short |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
title_full |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
title_fullStr |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
title_full_unstemmed |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
title_sort |
Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor |
author |
Silva, Ronaldo Rodrigues da |
author_facet |
Silva, Ronaldo Rodrigues da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Ronaldo Rodrigues da |
dc.contributor.advisor1.fl_str_mv |
Costa, João Paulo Carvalho Lustosa da |
contributor_str_mv |
Costa, João Paulo Carvalho Lustosa da |
dc.subject.keyword.en.fl_str_mv |
Comparação forense de locutor (CFL) Gravações de áudio Multivariate Kernel-Density (MVKD) |
topic |
Comparação forense de locutor (CFL) Gravações de áudio Multivariate Kernel-Density (MVKD) |
description |
Dissertação (mestrado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. |
publishDate |
2016 |
dc.date.submitted.none.fl_str_mv |
2016-12-13 |
dc.date.accessioned.fl_str_mv |
2017-03-22T16:52:27Z |
dc.date.available.fl_str_mv |
2017-03-22T16:52:27Z |
dc.date.issued.fl_str_mv |
2017-03-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Ronaldo Rodrigues da. Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor. 2016. xiv, 61 f., il. Dissertação (Mestrado em Engenharia Elétrica) — Universidade de Brasília, Brasília, 2016. |
dc.identifier.uri.fl_str_mv |
http://repositorio.unb.br/handle/10482/22993 |
dc.identifier.doi.none.fl_str_mv |
http://dx.doi.org/10.26512/2016.12.D.22993 |
identifier_str_mv |
SILVA, Ronaldo Rodrigues da. Aplicação do valor de base da frequência fundamental via estatística MVKD em comparação forense de locutor. 2016. xiv, 61 f., il. Dissertação (Mestrado em Engenharia Elétrica) — Universidade de Brasília, Brasília, 2016. |
url |
http://repositorio.unb.br/handle/10482/22993 http://dx.doi.org/10.26512/2016.12.D.22993 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
bitstream.url.fl_str_mv |
http://repositorio2.unb.br/jspui/bitstream/10482/22993/1/2016_RonaldoRodriguesdaSilva.pdf http://repositorio2.unb.br/jspui/bitstream/10482/22993/2/license.txt |
bitstream.checksum.fl_str_mv |
9db7accbea588ec2c50174217c542007 6d393f7933dc9d9c06887925dcb9ecbf |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
|
_version_ |
1803573615129526272 |