Uso de características significativas em sistema de identificação de língua em música

Detalhes bibliográficos
Autor(a) principal: Slaviero, Douglas Eduardo
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UCS
Texto Completo: https://repositorio.ucs.br/11338/11991
Resumo: No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]
id UCS_c4c534bde7966a3a6ad0aa5f61094ceb
oai_identifier_str oai:repositorio.ucs.br:11338/11991
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Slaviero, Douglas EduardoWebber, Carine GeltrudesNotari, Daniel LuísAdami, André Gustavo2023-05-18T18:11:23Z2023-05-18T18:11:23Z2022-12-152022-12-01https://repositorio.ucs.br/11338/11991No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]Aprendizado profundo (Aprendizado do computador)MúsicaUso de características significativas em sistema de identificação de língua em músicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do SulBacharelado em Ciência da ComputaçãoCampus Universitário de Caxias do Sul2022-12-14ORIGINALTCC Douglas Eduardo Slaviero.pdfTCC Douglas Eduardo Slaviero.pdfapplication/pdf2942573https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdfc9575c1cc1bba185acadb7e709ed3a63MD51TEXTTCC Douglas Eduardo Slaviero.pdf.txtTCC Douglas Eduardo Slaviero.pdf.txtExtracted texttext/plain102837https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt5138f6cab6ef63aa794d140f44706dc0MD52THUMBNAILTCC Douglas Eduardo Slaviero.pdf.jpgTCC Douglas Eduardo Slaviero.pdf.jpgGenerated Thumbnailimage/jpeg1284https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg4039846111da731271fa31212b1eebbcMD5311338/119912023-05-19 07:00:45.532oai:repositorio.ucs.br:11338/11991Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:03:19.481716Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.pt_BR.fl_str_mv Uso de características significativas em sistema de identificação de língua em música
title Uso de características significativas em sistema de identificação de língua em música
spellingShingle Uso de características significativas em sistema de identificação de língua em música
Slaviero, Douglas Eduardo
Aprendizado profundo (Aprendizado do computador)
Música
title_short Uso de características significativas em sistema de identificação de língua em música
title_full Uso de características significativas em sistema de identificação de língua em música
title_fullStr Uso de características significativas em sistema de identificação de língua em música
title_full_unstemmed Uso de características significativas em sistema de identificação de língua em música
title_sort Uso de características significativas em sistema de identificação de língua em música
author Slaviero, Douglas Eduardo
author_facet Slaviero, Douglas Eduardo
author_role author
dc.contributor.other.none.fl_str_mv Webber, Carine Geltrudes
Notari, Daniel Luís
dc.contributor.author.fl_str_mv Slaviero, Douglas Eduardo
dc.contributor.advisor1.fl_str_mv Adami, André Gustavo
contributor_str_mv Adami, André Gustavo
dc.subject.por.fl_str_mv Aprendizado profundo (Aprendizado do computador)
Música
topic Aprendizado profundo (Aprendizado do computador)
Música
description No decorrer dos anos a indústria da música vem se adaptando e, atualmente, está passando por um estágio de transição. A receita, que tinha seu predomínio em vendas de mídias físicas, passou a ser majoritariamente de serviços de streaming. Com o advento dos serviços de streaming, o modo de consumir e ouvir mídias de áudio se tornou uma experiência além da música. Conteúdos categorizados, gerando recomendações segundo as características e históricos dos usuários, são cada vez mais utilizados. Uma das informações que pode ser utilizada no intuito de categorizar as músicas é a língua. A partir dela é possível explorar mais pontos do seu âmbito, como reconhecimento de locutor e transcrição de letras. Trabalhos de identificação de língua em música, em sua grande maioria, exploram características estáticas do sinal de áudio propostas para o reconhecimento de fala e não o de língua. Visando contornar essa limitação, o objetivo deste trabalho foi avaliar o uso da rede SincNet em um modelo deep learning para fazer a extração de características significativas do sinal de áudio, para ser feita a identifica ção de língua em música. Além disso, este trabalho emprega o uso de diferentes técnicas de processamento de sinais para dirimir informações irrelevantes (por exemplo, som instrumental ou plateia) do sinal de música. Assim, o sistema proposto, primeiramente, remove os segmentos onde a voz cantante não ocorre (segmentação) e em seguida separa o sinal da voz do som instrumental (separação de áudio). O sinal de voz é alimentado na rede deep learning para extração de características e identificação da língua. O sistema proposto foi avaliado em uma base construída a partir das músicas de um serviço de streaming. Os resultados mostraram que as etapas de pré-processamento, segmentação e separação contribuem significativamente para o desempenho do sistema. Além disso, o sistema proposto obteve desempenho superior de aproximadamente 12% em comparação com sistema utilizando características estáticas e mesmas etapas de pré-processamento. [resumo fornecido pelo autor]
publishDate 2022
dc.date.submitted.none.fl_str_mv 2022-12-01
dc.date.issued.fl_str_mv 2022-12-15
dc.date.accessioned.fl_str_mv 2023-05-18T18:11:23Z
dc.date.available.fl_str_mv 2023-05-18T18:11:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/11338/11991
url https://repositorio.ucs.br/11338/11991
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/11991/1/TCC%20Douglas%20Eduardo%20Slaviero.pdf
https://repositorio.ucs.br/xmlui/bitstream/11338/11991/2/TCC%20Douglas%20Eduardo%20Slaviero.pdf.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/11991/3/TCC%20Douglas%20Eduardo%20Slaviero.pdf.jpg
bitstream.checksum.fl_str_mv c9575c1cc1bba185acadb7e709ed3a63
5138f6cab6ef63aa794d140f44706dc0
4039846111da731271fa31212b1eebbc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1813258442958176256