Sistema semiautomático de reconhecimento de identidade vocal forense.

MOREIRA, Danilo Coura.

Sistema semiautomático de reconhecimento de identidade vocal forense.

Detalhes bibliográficos
Autor(a) principal:	MOREIRA, Danilo Coura.
Data de Publicação:	2013
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
Resumo:	Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.

Metadados do item

id	UFCG_4eb5130d2d3f0786bf0cbb60b53366c9
oai_identifier_str	oai:localhost:riufcg/12352
network_acronym_str	UFCG
network_name_str	Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str	4851
spelling	Sistema semiautomático de reconhecimento de identidade vocal forense.Semiautomatic forensic vocal identity recognition system.Fonética ForenseIdentificação de LocutorCaracterísticas VocaisReconhecimento Semiautomático da Identidade VocalAmbiente TelefônicoInvestigações Criminaiscoeficientes mel-cepstrais (MFCC)modelo de misturas gaussianas (GMM)Forensic PhoneticsSpeaker IdentificationVocal CharacteristicsSemiautomatic Recognition of Vocal IdentityTelephone EnvironmentCriminal InvestigationsHoney-cepstral Coefficients (MFCC)Model of Gaussian Mixtures (GMM)Ciência da ComputaçãoDevido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.Due to the development of telephone networks, the use of this environment to support criminals to commit crimes is increasingly common. Based, then, on the possibility of individualizing one person from their vocal characteristics, this work proposes using techniques for the semiautomatic vocal identity recognition of speakers in telephone environment, aiming help in criminal investigations, directing the attribution of voice authorship and, thus, suiting as evidence in forensic. For that purpose, are used DC offset, vocal detector activity, spectral subtraction, normalization and pre-emphasis such as pre-processing techniques of speech signal, which aim to minimize the negative effects that provides the telephone environment utterances transmitted by these means, reducing the errors in feature extraction and subsequently, in the patterns creation of each speaker. In order to optimize the processing efficiency and robustness to noise compared to other methods for feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) was employed. To create the speakers patterns and classification, it was used the Gaussian Mixture Model (GMM), because provide better results when there is no dependence of text, due to the speakers are non-cooperative. Aiming at finding the best parameter setting for the semi-automatic system, experiments were performed considering an automatic vocal identity recognition system. In this way, it was possible reach to correct identification rate of up to 87.80%, with a confidence level of 98%. Lastly, the semiautomatic speaker identification system reached the probability of 99.95% that a given utterance belongs to a given speaker from a set of 30 suspects, using a confidence level of 98%. Thus, the proposed technique has enabled to provide, with a tax rate close to 100%, a subset of speakers suspects for subsequent forensic analysis.Universidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGARAÚJO, Joseana Macêdo Fechine Régis de.ARAÚJO, J. M. F. R.http://lattes.cnpq.br/7179691582151907MOREIRA, Danilo Coura.2013-092020-03-05T12:32:48Z2020-03-052020-03-05T12:32:48Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2022-03-21T20:18:53Zoai:localhost:riufcg/12352Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.bropendoar:48512022-03-21T20:18:53Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv	Sistema semiautomático de reconhecimento de identidade vocal forense. Semiautomatic forensic vocal identity recognition system.
title	Sistema semiautomático de reconhecimento de identidade vocal forense.
spellingShingle	Sistema semiautomático de reconhecimento de identidade vocal forense. MOREIRA, Danilo Coura. Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação
title_short	Sistema semiautomático de reconhecimento de identidade vocal forense.
title_full	Sistema semiautomático de reconhecimento de identidade vocal forense.
title_fullStr	Sistema semiautomático de reconhecimento de identidade vocal forense.
title_full_unstemmed	Sistema semiautomático de reconhecimento de identidade vocal forense.
title_sort	Sistema semiautomático de reconhecimento de identidade vocal forense.
author	MOREIRA, Danilo Coura.
author_facet	MOREIRA, Danilo Coura.
author_role	author
dc.contributor.none.fl_str_mv	ARAÚJO, Joseana Macêdo Fechine Régis de. ARAÚJO, J. M. F. R. http://lattes.cnpq.br/7179691582151907
dc.contributor.author.fl_str_mv	MOREIRA, Danilo Coura.
dc.subject.por.fl_str_mv	Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação
topic	Fonética Forense Identificação de Locutor Características Vocais Reconhecimento Semiautomático da Identidade Vocal Ambiente Telefônico Investigações Criminais coeficientes mel-cepstrais (MFCC) modelo de misturas gaussianas (GMM) Forensic Phonetics Speaker Identification Vocal Characteristics Semiautomatic Recognition of Vocal Identity Telephone Environment Criminal Investigations Honey-cepstral Coefficients (MFCC) Model of Gaussian Mixtures (GMM) Ciência da Computação
description	Devido ao desenvolvimento das redes de telefonia, o uso deste meio como auxílio para os criminosos cometerem seus delitos é cada vez mais frequente. Baseado, então, na possibilidade de individualizar uma pessoa a partir de suas características vocais, nesta pesquisa propõe-se utilizar técnicas para o reconhecimento semiautomático da identidade vocal de locutores em ambiente telefônico, buscando auxiliar as investigações criminais, direcionando a imputação de autoria de uma voz e, portanto, servindo como meio de prova, na área forense. Para tanto, são utilizada a remoção do nível DC, a detecção de atividade vocal, a subtração spectral, a normalização e a préênfase como técnicas para o pré-processamento do sinal de voz, visando a minimizar os efeitos negativos que o ambiente telefônico oferece às elocuções transmitidas por este meio reduzindo, assim, os erros na extração das características e, posteriormente, na criação dos padrões de cada locutor. Visando à eficiência no processamento e à robustez ao ruído, em relação a outros métodos de extração de características, foram utilizados coeficientes mel-cepstrais (MFCC) para este fim. Para a criação e a classificação dos padrões dos locutores, utilizou-se o modelo de misturas gaussianas (GMM), por proporcionar resultados melhores quando não há dependência de texto, dado que os locutores são não colaborativos. Visando a encontrar a melhor configuração de parâmetros para o sistema semiautomático, foram realizados experimentos considerando um sistema automático de reconhecimento de identidade vocal. Desta forma, foi obtida uma taxa de identificação de até 87,80%, com nível de confiança de 98%. Por fim, o sistema semiautomático de reconhecimento de identidade vocal atingiu a probabilidade de 99,95% de que determinada elocução pertença a um locutor, dentre um conjunto de 30 suspeitos, utilizando um nível de confiança de 98%. Desta forma, a técnica proposta possibilitou fornecer, com uma taxa de acerto próxima a 100%, um subconjunto de locutores suspeitos para posterior análise pericial.
publishDate	2013
dc.date.none.fl_str_mv	2013-09 2020-03-05T12:32:48Z 2020-03-05 2020-03-05T12:32:48Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352 MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
url	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
identifier_str_mv	MOREIRA, Danilo Coura. Sistema semiautomático de reconhecimento de identidade vocal forense. 2013. 151f. (Dissertação) Mestrado em Ciência da Computação, Programa de Pós-graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Campina Grande - Paraíba - Brasil, 2013. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/12352
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG
publisher.none.fl_str_mv	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG
instname_str	Universidade Federal de Campina Grande (UFCG)
instacron_str	UFCG
institution	UFCG
reponame_str	Biblioteca Digital de Teses e Dissertações da UFCG
collection	Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv	bdtd@setor.ufcg.edu.br \|\| bdtd@setor.ufcg.edu.br
_version_	1809744440273666048

Sistema semiautomático de reconhecimento de identidade vocal forense.

Registros relacionados