Uso de características significativas em sistema de identificação de língua em música
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/11338/11991 |
Resumo: | No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor] |
id |
UCS_c4c534bde7966a3a6ad0aa5f61094ceb |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/11991 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Slaviero, Douglas EduardoWebber, Carine GeltrudesNotari, Daniel LuísAdami, André Gustavo2023-05-18T18:11:23Z2023-05-18T18:11:23Z2022-12-152022-12-01https://repositorio.ucs.br/11338/11991No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]Aprendizado profundo (Aprendizado do computador)MúsicaUso de características significativas em sistema de identificação de língua em músicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoCampus Universitário de Caxias do Sul2022-12-14ORIGINALTCC Douglas Eduardo Slaviero.pdfTCC Douglas Eduardo Slaviero.pdfapplication/pdf2942573https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdfc9575c1cc1bba185acadb7e709ed3a63MD51TEXTTCC Douglas Eduardo Slaviero.pdf.txtTCC Douglas Eduardo Slaviero.pdf.txtExtracted texttext/plain102837https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt5138f6cab6ef63aa794d140f44706dc0MD52THUMBNAILTCC Douglas Eduardo Slaviero.pdf.jpgTCC Douglas Eduardo Slaviero.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg4039846111da731271fa31212b1eebbcMD5311338/119912023-05-19 07:00:45.532oai:repositorio.ucs.br:11338/11991Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:03:19.481716Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.pt_BR.fl_str_mv |
Uso de características significativas em sistema de identificação de língua em música |
title |
Uso de características significativas em sistema de identificação de língua em música |
spellingShingle |
Uso de características significativas em sistema de identificação de língua em música Slaviero, Douglas Eduardo Aprendizado profundo (Aprendizado do computador) Música |
title_short |
Uso de características significativas em sistema de identificação de língua em música |
title_full |
Uso de características significativas em sistema de identificação de língua em música |
title_fullStr |
Uso de características significativas em sistema de identificação de língua em música |
title_full_unstemmed |
Uso de características significativas em sistema de identificação de língua em música |
title_sort |
Uso de características significativas em sistema de identificação de língua em música |
author |
Slaviero, Douglas Eduardo |
author_facet |
Slaviero, Douglas Eduardo |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Webber, Carine Geltrudes Notari, Daniel Luís |
dc.contributor.author.fl_str_mv |
Slaviero, Douglas Eduardo |
dc.contributor.advisor1.fl_str_mv |
Adami, André Gustavo |
contributor_str_mv |
Adami, André Gustavo |
dc.subject.por.fl_str_mv |
Aprendizado profundo (Aprendizado do computador) Música |
topic |
Aprendizado profundo (Aprendizado do computador) Música |
description |
No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor] |
publishDate |
2022 |
dc.date.submitted.none.fl_str_mv |
2022-12-01 |
dc.date.issued.fl_str_mv |
2022-12-15 |
dc.date.accessioned.fl_str_mv |
2023-05-18T18:11:23Z |
dc.date.available.fl_str_mv |
2023-05-18T18:11:23Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/11338/11991 |
url |
https://repositorio.ucs.br/11338/11991 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg |
bitstream.checksum.fl_str_mv |
c9575c1cc1bba185acadb7e709ed3a63 5138f6cab6ef63aa794d140f44706dc0 4039846111da731271fa31212b1eebbc |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1813258442958176256 |