Sistema semiautomático de reconhecimento de identidade vocal forense.

Detalhes bibliográficos
Autor(a) principal: MOREIRA, Danilo Coura.
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
Resumo: Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.
id UFCG_4eb5130d2d3f0786bf0cbb60b53366c9
oai_identifier_str oai:localhost:riufcg/12352
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling Sistema semiautomático de reconhecimento de identidade vocal forense.Semiautomatic forensic vocal identity recognition system.Fonética ForenseIdentificação de LocutorCaracterísticas VocaisReconhecimento Semiautomático da Identidade VocalAmbiente TelefônicoInvestigações Criminaiscoeficientes mel-cepstrais (MFCC)modelo de misturas gaussianas (GMM)Forensic PhoneticsSpeaker IdentificationVocal CharacteristicsSemiautomatic Recognition of Vocal IdentityTelephone EnvironmentCriminal InvestigationsHoney-cepstral Coefficients (MFCC)Model of Gaussian Mixtures (GMM)Ciência da ComputaçãoDevido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.Due to the development of telephone networks, the use of this environment to support criminals to commit crimes is increasingly common. Based, then, on the possibility of individualizing one person from their vocal characteristics, this work proposes using techniques for the semiautomatic vocal identity recognition of speakers in telephone environment, aiming help in criminal investigations, directing the attribution of voice authorship and, thus, suiting as evidence in forensic. For that purpose, are used DC offset, vocal detector activity, spectral subtraction, normalization and pre-emphasis such as pre-processing techniques of speech signal, which aim to minimize the negative effects that provides the telephone environment utterances transmitted by these means, reducing the errors in feature extraction and subsequently, in the patterns creation of each speaker. In order to optimize the processing efficiency and robustness to noise compared to other methods for feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) was employed. To create the speakers patterns and classification, it was used the Gaussian Mixture Model (GMM), because provide better results when there is no dependence of text, due to the speakers are non-cooperative. Aiming at finding the best parameter setting for the semi-automatic system, experiments were performed considering an automatic vocal identity recognition system. In this way, it was possible reach to correct identification rate of up to 87.80%, with a confidence level of 98%. Lastly, the semiautomatic speaker identification system reached the probability of 99.95% that a given utterance belongs to a given speaker from a set of 30 suspects, using a confidence level of 98%. Thus, the proposed technique has enabled to provide, with a tax rate close to 100%, a subset of speakers suspects for subsequent forensic analysis.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGARAÚJO, Joseana Macêdo Fechine Régis de.ARAÚJO, J. M. F. R.http://lattes.cnpq.br/7179691582151907MOREIRA, Danilo Coura.2013-092020-03-05T12:32:48Z2020-03-052020-03-05T12:32:48Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-21T20:18:53Zoai:localhost:riufcg/12352Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-03-21T20:18:53Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv Sistema semiautomático de reconhecimento de identidade vocal forense.
Semiautomatic forensic vocal identity recognition system.
title Sistema semiautomático de reconhecimento de identidade vocal forense.
spellingShingle Sistema semiautomático de reconhecimento de identidade vocal forense.
MOREIRA, Danilo Coura.
Fonética Forense
Identificação de Locutor
Características Vocais
Reconhecimento Semiautomático da Identidade Vocal
Ambiente Telefônico
Investigações Criminais
coeficientes mel-cepstrais (MFCC)
modelo de misturas gaussianas (GMM)
Forensic Phonetics
Speaker Identification
Vocal Characteristics
Semiautomatic Recognition of Vocal Identity
Telephone Environment
Criminal Investigations
Honey-cepstral Coefficients (MFCC)
Model of Gaussian Mixtures (GMM)
Ciência da Computação
title_short Sistema semiautomático de reconhecimento de identidade vocal forense.
title_full Sistema semiautomático de reconhecimento de identidade vocal forense.
title_fullStr Sistema semiautomático de reconhecimento de identidade vocal forense.
title_full_unstemmed Sistema semiautomático de reconhecimento de identidade vocal forense.
title_sort Sistema semiautomático de reconhecimento de identidade vocal forense.
author MOREIRA, Danilo Coura.
author_facet MOREIRA, Danilo Coura.
author_role author
dc.contributor.none.fl_str_mv ARAÚJO, Joseana Macêdo Fechine Régis de.
ARAÚJO, J. M. F. R.
http://lattes.cnpq.br/7179691582151907
dc.contributor.author.fl_str_mv MOREIRA, Danilo Coura.
dc.subject.por.fl_str_mv Fonética Forense
Identificação de Locutor
Características Vocais
Reconhecimento Semiautomático da Identidade Vocal
Ambiente Telefônico
Investigações Criminais
coeficientes mel-cepstrais (MFCC)
modelo de misturas gaussianas (GMM)
Forensic Phonetics
Speaker Identification
Vocal Characteristics
Semiautomatic Recognition of Vocal Identity
Telephone Environment
Criminal Investigations
Honey-cepstral Coefficients (MFCC)
Model of Gaussian Mixtures (GMM)
Ciência da Computação
topic Fonética Forense
Identificação de Locutor
Características Vocais
Reconhecimento Semiautomático da Identidade Vocal
Ambiente Telefônico
Investigações Criminais
coeficientes mel-cepstrais (MFCC)
modelo de misturas gaussianas (GMM)
Forensic Phonetics
Speaker Identification
Vocal Characteristics
Semiautomatic Recognition of Vocal Identity
Telephone Environment
Criminal Investigations
Honey-cepstral Coefficients (MFCC)
Model of Gaussian Mixtures (GMM)
Ciência da Computação
description Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.
publishDate 2013
dc.date.none.fl_str_mv 2013-09
2020-03-05T12:32:48Z
2020-03-05
2020-03-05T12:32:48Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
identifier_str_mv MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744440273666048