Sistema semiautomático de reconhecimento de identidade vocal forense.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFCG |
Texto Completo: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 |
Resumo: | Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial. |
id |
UFCG_4eb5130d2d3f0786bf0cbb60b53366c9 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/12352 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
4851 |
spelling |
Sistema semiautomático de reconhecimento de identidade vocal forense.Semiautomatic forensic vocal identity recognition system.Fonética ForenseIdentificação de LocutorCaracterísticas VocaisReconhecimento Semiautomático da Identidade VocalAmbiente TelefônicoInvestigações Criminaiscoeficientes mel-cepstrais (MFCC)modelo de misturas gaussianas (GMM)Forensic PhoneticsSpeaker IdentificationVocal CharacteristicsSemiautomatic Recognition of Vocal IdentityTelephone EnvironmentCriminal InvestigationsHoney-cepstral Coefficients (MFCC)Model of Gaussian Mixtures (GMM)Ciência da ComputaçãoDevido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.Due to the development of telephone networks, the use of this environment to support criminals to commit crimes is increasingly common. Based, then, on the possibility of individualizing one person from their vocal characteristics, this work proposes using techniques for the semiautomatic vocal identity recognition of speakers in telephone environment, aiming help in criminal investigations, directing the attribution of voice authorship and, thus, suiting as evidence in forensic. For that purpose, are used DC offset, vocal detector activity, spectral subtraction, normalization and pre-emphasis such as pre-processing techniques of speech signal, which aim to minimize the negative effects that provides the telephone environment utterances transmitted by these means, reducing the errors in feature extraction and subsequently, in the patterns creation of each speaker. In order to optimize the processing efficiency and robustness to noise compared to other methods for feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) was employed. To create the speakers patterns and classification, it was used the Gaussian Mixture Model (GMM), because provide better results when there is no dependence of text, due to the speakers are non-cooperative. Aiming at finding the best parameter setting for the semi-automatic system, experiments were performed considering an automatic vocal identity recognition system. In this way, it was possible reach to correct identification rate of up to 87.80%, with a confidence level of 98%. Lastly, the semiautomatic speaker identification system reached the probability of 99.95% that a given utterance belongs to a given speaker from a set of 30 suspects, using a confidence level of 98%. Thus, the proposed technique has enabled to provide, with a tax rate close to 100%, a subset of speakers suspects for subsequent forensic analysis.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGARAÚJO, Joseana Macêdo Fechine Régis de.ARAÚJO, J. M. F. R.http://lattes.cnpq.br/7179691582151907MOREIRA, Danilo Coura.2013-092020-03-05T12:32:48Z2020-03-052020-03-05T12:32:48Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-21T20:18:53Zoai:localhost:riufcg/12352Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-21T20:18:53Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.none.fl_str_mv |
Sistema semiautomático de reconhecimento de identidade vocal forense. Semiautomatic forensic vocal identity recognition system. |
title |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
spellingShingle |
Sistema semiautomático de reconhecimento de identidade vocal forense. MOREIRA, Danilo Coura. Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação |
title_short |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
title_full |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
title_fullStr |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
title_full_unstemmed |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
title_sort |
Sistema semiautomático de reconhecimento de identidade vocal forense. |
author |
MOREIRA, Danilo Coura. |
author_facet |
MOREIRA, Danilo Coura. |
author_role |
author |
dc.contributor.none.fl_str_mv |
ARAÚJO, Joseana Macêdo Fechine Régis de. ARAÚJO, J. M. F. R. http://lattes.cnpq.br/7179691582151907 |
dc.contributor.author.fl_str_mv |
MOREIRA, Danilo Coura. |
dc.subject.por.fl_str_mv |
Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação |
topic |
Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação |
description |
Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013-09 2020-03-05T12:32:48Z 2020-03-05 2020-03-05T12:32:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 |
identifier_str_mv |
MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1809744440273666048 |