Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores

Detalhes bibliográficos
Autor(a) principal: Adelino Pinheiro Silva
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/33823
Resumo: A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais.
id UFMG_5d733ae29fc9412131551ae5dd65d7d7
oai_identifier_str oai:repositorio.ufmg.br:1843/33823
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Maurílio Nunes Vieirahttp://lattes.cnpq.br/1636687509748198Adriano Vilela BarbosaLuiz Wagner Pereira BiscainhoPlinio Almeida BarbosaFrederico Rodrigues Borges da CruzHani Camille YehiaZelia Myriam Assis Peixotohttp://lattes.cnpq.br/8373538496107754Adelino Pinheiro Silva2020-07-17T00:42:59Z2020-07-17T00:42:59Z2020-04-16http://hdl.handle.net/1843/338230000-0002-2796-4841A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais.Forensic Speaker Comparison (FSC) is an analysis of two voice samples to infer the similarity of their features. One voice sample is a trace of a criminal fact, while the other is from a known individual. FSC differs from voice biometrics in several ways. Biometrics allows the control of some variables not controllable in FSC, among them, the recording device, the channel noise, the quantity and duration of the samples, and speaker cooperation. Also, there is no risk of associating (or failing to associate) an innocent to guilty part. The new paradigm shift of forensic sciences can be characterized as quantitative databased implementation of the likelihood-ratio framework with quantitative evaluation of the reliability of results. This thesis presents two lines of experimental work within the new paradigm shift. The experiments were conducted using two databases for training and validation. Parameters such as noise type and intensity of speech contamination, as well as the duration of the speech sample were evaluated. The first line developed a synthetic solution for the Full Bayesian Significance Test (FBST) over the mean with unknown variance, proposing an interval estimation, hereinafter referred to as evidence interval, applicable to the FSC. In the experiments, variation of the SNR showed the evidence interval reduced error rates (Type I and Type II) by approximately 6.4%, surpassing other evaluated methods. The second line of investigation proposed the use of Spectrographic Signal-to-Noise Ratio (S2NR) measures to separate the signal into fuzzy sets for the comparison of speakers. Moreover, it was also proposed an adaptation for the calculation of the Baum-Welch statistics. Experiments with combinations of SNR and speech size showed the proposed method reduced false-positive rates by 35.7%, rising also accuracy in 4.5%, compared to other evaluated techniques. The results are promising and are being used experimentally at the Instituto de Criminalística of Polícia Civil de Minas Gerais.porUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Engenharia ElétricaUFMGBrasilENGENHARIA - ESCOLA DE ENGENHARIAhttp://creativecommons.org/licenses/by-nc-sa/3.0/pt/info:eu-repo/semantics/openAccessEngenharia elétricaFonética forenseProcessamento de sinaisReconhecimento de padrõesComparação forense de locutorFonética forenseCiência e tecnologia da falaProcessamento de sinaisReconhecimento de padrõesIntervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALIntervalo de Evidência e Pareamento Fuzzy Utilizando Relação Sinal-Ruído Aplicados à Comparação Forense de Locutores.pdfIntervalo de Evidência e Pareamento Fuzzy Utilizando Relação Sinal-Ruído Aplicados à Comparação Forense de Locutores.pdfapplication/pdf5745556https://repositorio.ufmg.br/bitstream/1843/33823/1/Intervalo%20de%20Evid%c3%aancia%20e%20Pareamento%20Fuzzy%20Utilizando%20Rela%c3%a7%c3%a3o%20Sinal-Ru%c3%addo%20Aplicados%20%c3%a0%20Compara%c3%a7%c3%a3o%20Forense%20de%20Locutores.pdf9d95a26f51f5024cf135d6effa7ec9fdMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://repositorio.ufmg.br/bitstream/1843/33823/2/license_rdfd434b2e45b27c6ef831461f4412a9d4eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82119https://repositorio.ufmg.br/bitstream/1843/33823/3/license.txt34badce4be7e31e3adb4575ae96af679MD531843/338232020-07-16 21:42:59.608oai:repositorio.ufmg.br:1843/33823TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KCg==Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2020-07-17T00:42:59Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
title Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
spellingShingle Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
Adelino Pinheiro Silva
Comparação forense de locutor
Fonética forense
Ciência e tecnologia da fala
Processamento de sinais
Reconhecimento de padrões
Engenharia elétrica
Fonética forense
Processamento de sinais
Reconhecimento de padrões
title_short Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
title_full Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
title_fullStr Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
title_full_unstemmed Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
title_sort Intervalo de evidência e pareamento fuzzy utilizando relação sinal ruído aplicados à comparação forense de locutores
author Adelino Pinheiro Silva
author_facet Adelino Pinheiro Silva
author_role author
dc.contributor.advisor1.fl_str_mv Maurílio Nunes Vieira
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1636687509748198
dc.contributor.advisor-co1.fl_str_mv Adriano Vilela Barbosa
dc.contributor.referee1.fl_str_mv Luiz Wagner Pereira Biscainho
dc.contributor.referee2.fl_str_mv Plinio Almeida Barbosa
dc.contributor.referee3.fl_str_mv Frederico Rodrigues Borges da Cruz
dc.contributor.referee4.fl_str_mv Hani Camille Yehia
dc.contributor.referee5.fl_str_mv Zelia Myriam Assis Peixoto
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/8373538496107754
dc.contributor.author.fl_str_mv Adelino Pinheiro Silva
contributor_str_mv Maurílio Nunes Vieira
Adriano Vilela Barbosa
Luiz Wagner Pereira Biscainho
Plinio Almeida Barbosa
Frederico Rodrigues Borges da Cruz
Hani Camille Yehia
Zelia Myriam Assis Peixoto
dc.subject.por.fl_str_mv Comparação forense de locutor
Fonética forense
Ciência e tecnologia da fala
Processamento de sinais
Reconhecimento de padrões
topic Comparação forense de locutor
Fonética forense
Ciência e tecnologia da fala
Processamento de sinais
Reconhecimento de padrões
Engenharia elétrica
Fonética forense
Processamento de sinais
Reconhecimento de padrões
dc.subject.other.pt_BR.fl_str_mv Engenharia elétrica
Fonética forense
Processamento de sinais
Reconhecimento de padrões
description A Comparação Forense de Locutor (CFL) é o exame pericial que tem como tarefa analisar duas amostras de voz e inferir sobre a compatibilidade de suas características. Uma amostra de voz é vestígio de um fato típico penal enquanto a segunda é de um indivíduo conhecido. A CFL difere-se da biometria por voz em vários aspectos. A biometria permite o controle de algumas variáveis não disponíveis na CFL, entre elas, o dispositivo de gravação, o ruído de canal, a quantidade e duração das amostras e a cooperação dos locutores. Além disso, não existe o risco de associar incorretamente um inocente (erro do Tipo I) ou falhar em associar um culpado (erro do Tipo II). Neste cenário, a presente tese apresenta duas linhas de trabalho experimentais motivadas pelo paradigma das ciências forenses, o que inclui resultados quantitativos baseados em medidas estatísticas apoiadas por bancos de dados representativos. Os experimentos foram conduzidos para emular condições presentes na prática da CFL. Na primeira linha desenvolveu-se uma solução sintética para o Teste de Significância Genuinamente Bayesiano (FBST - Full Bayesian Significance Test) sobre a média com variância desconhecida propondo uma estimativa por intervalo, denominada intervalo de evidência, aplicável à CFL. Os experimentos com variação da SNR mostraram que o intervalo de evidência reduziu as taxas de erro (Tipo I e Tipo II) em torno de 6,4%, superando os demais métodos avaliados. A segunda linha propôs a utilização de medidas espectrais de relação sinal-ruído S2NR (Spectrographic Signal-to-Noise Ratio) para separar as características do sinal de voz em conjuntos nebulosos e realizar a comparação de locutores considerando a influência destes conjuntos. Nesta linha de trabalho propôs-se ainda uma adequação para o cálculo das estatísticas de Baum-Welch. Os experimentos, baseados em conjuntos nebulosos, variaram a SNR e o tamanho das amostras. Os resultados, em relação as outras técnicas, reduziram as taxas de falso positivo (erro Tipo I) em 35, 7% em amostras contaminadas, e apresentaram uma acurácia 4,5% superior para amostras com limitação de tamanho. Do ponto de vista prático, os resultados são promissores e estão sendo utilizados de forma experimental no Instituto de Criminalística da Polícia Civil de Minas Gerais.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-07-17T00:42:59Z
dc.date.available.fl_str_mv 2020-07-17T00:42:59Z
dc.date.issued.fl_str_mv 2020-04-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/33823
dc.identifier.orcid.pt_BR.fl_str_mv 0000-0002-2796-4841
url http://hdl.handle.net/1843/33823
identifier_str_mv 0000-0002-2796-4841
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/pt/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/pt/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ENGENHARIA - ESCOLA DE ENGENHARIA
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/33823/1/Intervalo%20de%20Evid%c3%aancia%20e%20Pareamento%20Fuzzy%20Utilizando%20Rela%c3%a7%c3%a3o%20Sinal-Ru%c3%addo%20Aplicados%20%c3%a0%20Compara%c3%a7%c3%a3o%20Forense%20de%20Locutores.pdf
https://repositorio.ufmg.br/bitstream/1843/33823/2/license_rdf
https://repositorio.ufmg.br/bitstream/1843/33823/3/license.txt
bitstream.checksum.fl_str_mv 9d95a26f51f5024cf135d6effa7ec9fd
d434b2e45b27c6ef831461f4412a9d4e
34badce4be7e31e3adb4575ae96af679
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589304913494016