Uso de características significativas em sistema de identificação de língua em música

Slaviero, Douglas Eduardo

Uso de características significativas em sistema de identificação de língua em música

Detalhes bibliográficos
Autor(a) principal:	Slaviero, Douglas Eduardo
Data de Publicação:	2022
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UCS
Texto Completo:	https://repositorio.ucs.br/11338/11991
Resumo:	No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]

Metadados do item

id	UCS_c4c534bde7966a3a6ad0aa5f61094ceb
oai_identifier_str	oai:repositorio.ucs.br:11338/11991
network_acronym_str	UCS
network_name_str	Repositório Institucional da UCS
repository_id_str
spelling	Slaviero, Douglas EduardoWebber, Carine GeltrudesNotari, Daniel LuísAdami, André Gustavo2023-05-18T18:11:23Z2023-05-18T18:11:23Z2022-12-152022-12-01https://repositorio.ucs.br/11338/11991No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]Aprendizado profundo (Aprendizado do computador)MúsicaUso de características significativas em sistema de identificação de língua em músicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoCampus Universitário de Caxias do Sul2022-12-14ORIGINALTCC Douglas Eduardo Slaviero.pdfTCC Douglas Eduardo Slaviero.pdfapplication/pdf2942573https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdfc9575c1cc1bba185acadb7e709ed3a63MD51TEXTTCC Douglas Eduardo Slaviero.pdf.txtTCC Douglas Eduardo Slaviero.pdf.txtExtracted texttext/plain102837https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt5138f6cab6ef63aa794d140f44706dc0MD52THUMBNAILTCC Douglas Eduardo Slaviero.pdf.jpgTCC Douglas Eduardo Slaviero.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg4039846111da731271fa31212b1eebbcMD5311338/119912023-05-19 07:00:45.532oai:repositorio.ucs.br:11338/11991Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:03:19.481716Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv	Uso de características significativas em sistema de identificação de língua em música
title	Uso de características significativas em sistema de identificação de língua em música
spellingShingle	Uso de características significativas em sistema de identificação de língua em música Slaviero, Douglas Eduardo Aprendizado profundo (Aprendizado do computador) Música
title_short	Uso de características significativas em sistema de identificação de língua em música
title_full	Uso de características significativas em sistema de identificação de língua em música
title_fullStr	Uso de características significativas em sistema de identificação de língua em música
title_full_unstemmed	Uso de características significativas em sistema de identificação de língua em música
title_sort	Uso de características significativas em sistema de identificação de língua em música
author	Slaviero, Douglas Eduardo
author_facet	Slaviero, Douglas Eduardo
author_role	author
dc.contributor.other.none.fl_str_mv	Webber, Carine Geltrudes Notari, Daniel Luís
dc.contributor.author.fl_str_mv	Slaviero, Douglas Eduardo
dc.contributor.advisor1.fl_str_mv	Adami, André Gustavo
contributor_str_mv	Adami, André Gustavo
dc.subject.por.fl_str_mv	Aprendizado profundo (Aprendizado do computador) Música
topic	Aprendizado profundo (Aprendizado do computador) Música
description	No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]
publishDate	2022
dc.date.submitted.none.fl_str_mv	2022-12-01
dc.date.issued.fl_str_mv	2022-12-15
dc.date.accessioned.fl_str_mv	2023-05-18T18:11:23Z
dc.date.available.fl_str_mv	2023-05-18T18:11:23Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ucs.br/11338/11991
url	https://repositorio.ucs.br/11338/11991
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS
instname_str	Universidade de Caxias do Sul (UCS)
instacron_str	UCS
institution	UCS
reponame_str	Repositório Institucional da UCS
collection	Repositório Institucional da UCS
bitstream.url.fl_str_mv	https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg
bitstream.checksum.fl_str_mv	c9575c1cc1bba185acadb7e709ed3a63 5138f6cab6ef63aa794d140f44706dc0 4039846111da731271fa31212b1eebbc
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_	1813258442958176256

Uso de características significativas em sistema de identificação de língua em música

Registros relacionados