Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/33823 |
Resumo: | A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais. |
id |
UFMG_5d733ae29fc9412131551ae5dd65d7d7 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/33823 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Maurílio Nunes Vieirahttp://lattes.cnpq.br/1636687509748198Adriano Vilela BarbosaLuiz Wagner Pereira BiscainhoPlinio Almeida BarbosaFrederico Rodrigues Borges da CruzHani Camille YehiaZelia Myriam Assis Peixotohttp://lattes.cnpq.br/8373538496107754Adelino Pinheiro Silva2020-07-17T00:42:59Z2020-07-17T00:42:59Z2020-04-16http://hdl.handle.net/1843/338230000-0002-2796-4841A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais.Forensic Speaker Comparison (FSC) is an analysis of two voice samples to infer the similarity of their features. One voice sample is a trace of a criminal fact, while the other is from a known individual. FSC differs from voice biometrics in several ways. Biometrics allows the control of some variables not controllable in FSC, among them, the recording device, the channel noise, the quantity and duration of the samples, and speaker cooperation. Also, there is no risk of associating (or failing to associate) an innocent to guilty part. The new paradigm shift of forensic sciences can be characterized as quantitative databased implementation of the likelihood-ratio framework with quantitative evaluation of the reliability of results. This thesis presents two lines of experimental work within the new paradigm shift. The experiments were conducted using two databases for training and validation. Parameters such as noise type and intensity of speech contamination, as well as the duration of the speech sample were evaluated. The first line developed a synthetic solution for the Full Bayesian Significance Test (FBST) over the mean with unknown variance, proposing an interval estimation, hereinafter referred to as evidence interval, applicable to the FSC. In the experiments, variation of the SNR showed the evidence interval reduced error rates (Type I and Type II) by approximately 6.4%, surpassing other evaluated methods. The second line of investigation proposed the use of Spectrographic Signal-to-Noise Ratio (S2NR) measures to separate the signal into fuzzy sets for the comparison of speakers. Moreover, it was also proposed an adaptation for the calculation of the Baum-Welch statistics. Experiments with combinations of SNR and speech size showed the proposed method reduced false-positive rates by 35.7%, rising also accuracy in 4.5%, compared to other evaluated techniques. The results are promising and are being used experimentally at the Instituto de Criminalística of Polícia Civil de Minas Gerais.porUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Engenharia ElétricaUFMGBrasilENGENHARIA - ESCOLA DE ENGENHARIAhttp://creativecommons.org/licenses/by-nc-sa/3.0/pt/info:eu-repo/semantics/openAccessEngenharia elétricaFonética forenseProcessamento de sinaisReconhecimento de padrõesComparação forense de locutorFonética forenseCiência e tecnologia da falaProcessamento de sinaisReconhecimento de padrõesIntervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALIntervalo de Evidência e Pareamento Fuzzy Utilizando Relação Sinal-Ruído Aplicados à Comparação Forense de Locutores.pdfIntervalo de Evidência e Pareamento Fuzzy Utilizando Relação Sinal-Ruído Aplicados à Comparação Forense de Locutores.pdfapplication/pdf5745556https://repositorio.ufmg.br/bitstream/1843/33823/1/Intervalo%20de%20Evid%c3%aancia%20e%20Pareamento%20Fuzzy%20Utilizando%20Rela%c3%a7%c3%a3o%20Sinal-Ru%c3%addo%20Aplicados%20%c3%a0%20Compara%c3%a7%c3%a3o%20Forense%20de%20Locutores.pdf9d95a26f51f5024cf135d6effa7ec9fdMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://repositorio.ufmg.br/bitstream/1843/33823/2/license_rdfd434b2e45b27c6ef831461f4412a9d4eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82119https://repositorio.ufmg.br/bitstream/1843/33823/3/license.txt34badce4be7e31e3adb4575ae96af679MD531843/338232020-07-16 21:42:59.608oai:repositorio.ufmg.br:1843/33823TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2020-07-17T00:42:59Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
title |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
spellingShingle |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores Adelino Pinheiro Silva Comparação forense de locutor Fonética forense Ciência e tecnologia da fala Processamento de sinais Reconhecimento de padrões Engenharia elétrica Fonética forense Processamento de sinais Reconhecimento de padrões |
title_short |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
title_full |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
title_fullStr |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
title_full_unstemmed |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
title_sort |
Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores |
author |
Adelino Pinheiro Silva |
author_facet |
Adelino Pinheiro Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Maurílio Nunes Vieira |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1636687509748198 |
dc.contributor.advisor-co1.fl_str_mv |
Adriano Vilela Barbosa |
dc.contributor.referee1.fl_str_mv |
Luiz Wagner Pereira Biscainho |
dc.contributor.referee2.fl_str_mv |
Plinio Almeida Barbosa |
dc.contributor.referee3.fl_str_mv |
Frederico Rodrigues Borges da Cruz |
dc.contributor.referee4.fl_str_mv |
Hani Camille Yehia |
dc.contributor.referee5.fl_str_mv |
Zelia Myriam Assis Peixoto |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/8373538496107754 |
dc.contributor.author.fl_str_mv |
Adelino Pinheiro Silva |
contributor_str_mv |
Maurílio Nunes Vieira Adriano Vilela Barbosa Luiz Wagner Pereira Biscainho Plinio Almeida Barbosa Frederico Rodrigues Borges da Cruz Hani Camille Yehia Zelia Myriam Assis Peixoto |
dc.subject.por.fl_str_mv |
Comparação forense de locutor Fonética forense Ciência e tecnologia da fala Processamento de sinais Reconhecimento de padrões |
topic |
Comparação forense de locutor Fonética forense Ciência e tecnologia da fala Processamento de sinais Reconhecimento de padrões Engenharia elétrica Fonética forense Processamento de sinais Reconhecimento de padrões |
dc.subject.other.pt_BR.fl_str_mv |
Engenharia elétrica Fonética forense Processamento de sinais Reconhecimento de padrões |
description |
A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-07-17T00:42:59Z |
dc.date.available.fl_str_mv |
2020-07-17T00:42:59Z |
dc.date.issued.fl_str_mv |
2020-04-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/33823 |
dc.identifier.orcid.pt_BR.fl_str_mv |
0000-0002-2796-4841 |
url |
http://hdl.handle.net/1843/33823 |
identifier_str_mv |
0000-0002-2796-4841 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/3.0/pt/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/3.0/pt/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Elétrica |
dc.publisher.initials.fl_str_mv |
UFMG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ENGENHARIA - ESCOLA DE ENGENHARIA |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/33823/1/Intervalo%20de%20Evid%c3%aancia%20e%20Pareamento%20Fuzzy%20Utilizando%20Rela%c3%a7%c3%a3o%20Sinal-Ru%c3%addo%20Aplicados%20%c3%a0%20Compara%c3%a7%c3%a3o%20Forense%20de%20Locutores.pdf https://repositorio.ufmg.br/bitstream/1843/33823/2/license_rdf https://repositorio.ufmg.br/bitstream/1843/33823/3/license.txt |
bitstream.checksum.fl_str_mv |
9d95a26f51f5024cf135d6effa7ec9fd d434b2e45b27c6ef831461f4412a9d4e 34badce4be7e31e3adb4575ae96af679 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589304913494016 |