Diarização automática de locutor utilizando distâncias probabilísticas entre modelo

Azevedo, Rodrigo Bergamaschi de

Diarização automática de locutor utilizando distâncias probabilísticas entre modelo

Detalhes bibliográficos
Autor(a) principal:	Azevedo, Rodrigo Bergamaschi de
Data de Publicação:	2010
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UCS
Texto Completo:	https://repositorio.ucs.br/handle/11338/1427
Resumo:	Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).

Metadados do item

id	UCS_e5128a5c81880657fc93501c32731c90
oai_identifier_str	oai:repositorio.ucs.br:11338/1427
network_acronym_str	UCS
network_name_str	Repositório Institucional da UCS
repository_id_str
spelling	Azevedo, Rodrigo Bergamaschi deMartinotto, André LuisKoliver, CristianAdami, André Gustavo2016-12-21T18:29:36Z2016-12-21T18:29:36Z2010https://repositorio.ucs.br/handle/11338/1427Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).Banco de dadosSomFalaDiarização automática de locutor utilizando distâncias probabilísticas entre modeloinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoTEXTTCC Rodrigo Bergamaschi de Azevedo.pdf.txtTCC Rodrigo Bergamaschi de Azevedo.pdf.txtExtracted texttext/plain106323https://repositorio.ucs.br/xmlui/bitstream/11338/1427/3/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.txt3c4f84ea57788dfcc563728739d72838MD53THUMBNAILTCC Rodrigo Bergamaschi de Azevedo.pdf.jpgTCC Rodrigo Bergamaschi de Azevedo.pdf.jpgGenerated Thumbnailimage/jpeg1201https://repositorio.ucs.br/xmlui/bitstream/11338/1427/4/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.jpge92e89b81c0dfaa2b51a82602aff22c8MD54ORIGINALTCC Rodrigo Bergamaschi de Azevedo.pdfTCC Rodrigo Bergamaschi de Azevedo.pdfapplication/pdf1242192https://repositorio.ucs.br/xmlui/bitstream/11338/1427/1/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdff1d2e9ef48dda344d4d7bd2a65590632MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucs.br/xmlui/bitstream/11338/1427/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5211338/14272018-10-03 16:31:37.472oai:repositorio.ucs.br:11338/1427Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2018-10-03T16:31:37Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
spellingShingle	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo Azevedo, Rodrigo Bergamaschi de Banco de dados Som Fala
title_short	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_full	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_fullStr	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_full_unstemmed	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
title_sort	Diarização automática de locutor utilizando distâncias probabilísticas entre modelo
author	Azevedo, Rodrigo Bergamaschi de
author_facet	Azevedo, Rodrigo Bergamaschi de
author_role	author
dc.contributor.other.none.fl_str_mv	Martinotto, André Luis Koliver, Cristian
dc.contributor.author.fl_str_mv	Azevedo, Rodrigo Bergamaschi de
dc.contributor.advisor1.fl_str_mv	Adami, André Gustavo
contributor_str_mv	Adami, André Gustavo
dc.subject.por.fl_str_mv	Banco de dados Som Fala
topic	Banco de dados Som Fala
description	Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).
publishDate	2010
dc.date.submitted.none.fl_str_mv	2010
dc.date.accessioned.fl_str_mv	2016-12-21T18:29:36Z
dc.date.available.fl_str_mv	2016-12-21T18:29:36Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ucs.br/handle/11338/1427
url	https://repositorio.ucs.br/handle/11338/1427
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS
instname_str	Universidade de Caxias do Sul (UCS)
instacron_str	UCS
institution	UCS
reponame_str	Repositório Institucional da UCS
collection	Repositório Institucional da UCS
bitstream.url.fl_str_mv	https://repositorio.ucs.br/xmlui/bitstream/11338/1427/3/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/1427/4/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/1427/1/TCC%20Rodrigo%20Bergamaschi%20de%20Azevedo.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/1427/2/license.txt
bitstream.checksum.fl_str_mv	3c4f84ea57788dfcc563728739d72838 e92e89b81c0dfaa2b51a82602aff22c8 f1d2e9ef48dda344d4d7bd2a65590632 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_	1798308912585244672

Diarização automática de locutor utilizando distâncias probabilísticas entre modelo

Registros relacionados