Diarização automática de locutor utilizando distâncias probabilísticas entre modelo

Detalhes bibliográficos
Autor(a) principal: Azevedo, Rodrigo Bergamaschi de
Data de Publicação: 2010
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UCS
Texto Completo: https://repositorio.ucs.br/handle/11338/1427
Resumo: Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).
id UCS_e5128a5c81880657fc93501c32731c90
oai_identifier_str oai:repositorio.ucs.br:11338/1427
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Azevedo, Rodrigo Bergamaschi deMartinotto, André LuisKoliver, CristianAdami, André Gustavo2016-12-21T18:29:36Z2016-12-21T18:29:36Z2010https://repositorio.ucs.br/handle/11338/1427Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).Banco de dadosSomFalaDiarização automática de locutor utilizando distâncias probabilísticas entre modeloinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTEXTTCC Rodrigo Bergamaschi de Azevedo.pdf.txtTCC Rodrigo Bergamaschi de Azevedo.pdf.txtExtracted texttext/plain106323https://repositorio.ucs.br/xmlui/bitstream/11338/1427/3/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.txt3c4f84ea57788dfcc563728739d72838MD53THUMBNAILTCC Rodrigo Bergamaschi de Azevedo.pdf.jpgTCC Rodrigo Bergamaschi de Azevedo.pdf.jpgGenerated Thumbnailimage/jpeg1201https://repositorio.ucs.br/xmlui/bitstream/11338/1427/4/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.jpge92e89b81c0dfaa2b51a82602aff22c8MD54ORIGINALTCC Rodrigo Bergamaschi de Azevedo.pdfTCC Rodrigo Bergamaschi de Azevedo.pdfapplication/pdf1242192https://repositorio.ucs.br/xmlui/bitstream/11338/1427/1/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdff1d2e9ef48dda344d4d7bd2a65590632MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucs.br/xmlui/bitstream/11338/1427/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5211338/14272018-10-03 16:31:37.472oai:repositorio.ucs.br:11338/1427Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2018-10-03T16:31:37Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
spellingShingle Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
Azevedo, Rodrigo Bergamaschi de
Banco de dados
Som
Fala
title_short Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_full Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_fullStr Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_full_unstemmed Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_sort Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
author Azevedo, Rodrigo Bergamaschi de
author_facet Azevedo, Rodrigo Bergamaschi de
author_role author
dc.contributor.other.none.fl_str_mv Martinotto, André Luis
Koliver, Cristian
dc.contributor.author.fl_str_mv Azevedo, Rodrigo Bergamaschi de
dc.contributor.advisor1.fl_str_mv Adami, André Gustavo
contributor_str_mv Adami, André Gustavo
dc.subject.por.fl_str_mv Banco de dados
Som
Fala
topic Banco de dados
Som
Fala
description Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).
publishDate 2010
dc.date.submitted.none.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2016-12-21T18:29:36Z
dc.date.available.fl_str_mv 2016-12-21T18:29:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/handle/11338/1427
url https://repositorio.ucs.br/handle/11338/1427
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/1427/3/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/1427/4/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.jpg
https://repositorio.ucs.br/xmlui/bitstream/11338/1427/1/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf
https://repositorio.ucs.br/xmlui/bitstream/11338/1427/2/license.txt
bitstream.checksum.fl_str_mv 3c4f84ea57788dfcc563728739d72838
e92e89b81c0dfaa2b51a82602aff22c8
f1d2e9ef48dda344d4d7bd2a65590632
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1798308912585244672