Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | https://locus.ufv.br//handle/123456789/29684 https://doi.org/10.47328/ufvbbt.2021.015 |
Resumo: | O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música. |
id |
UFV_b577b8062d8ef832dcfed96cb92b6f36 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/29684 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Rodrigues, Matheus Augusto Gonzagahttp://lattes.cnpq.br/9263099563741253Oliveira, Alcione de Paiva2022-08-16T18:42:52Z2022-08-16T18:42:52Z2021-07-06RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.https://locus.ufv.br//handle/123456789/29684https://doi.org/10.47328/ufvbbt.2021.015O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.The field of natural language generation consists in the creation of texts that provide information contained in other types of sources (numerical data, graphics, taxonomies and ontologies or even other texts), in order to make these texts indistinguishable, as far as possible, of those created by humans. The automatic generation of text makes it possible to increase the production of textual material that can have different purposes, such as the production of teaching material, production of technical manuals, assistance in the production of scientific dissemination material, automatic generation of advertisement, etc. Within the scope of this task, the textual genre "song lyrics" stands out, characterized by its structure (structured in verses that are grouped into stanzas), by having rhyme and rhythm, and by being able to arouse emotions, once that the genre belongs to the artistic domain. Due to these characteristics, musical text production presents additional challenges compared to text production in general. The automatic generation of song lyrics can help artists in their compositions, reducing the time spent writing songs and promoting music production. The purpose of this research is to verify the feasibility of generating musical texts through the most recent models of deep learning. To achieve this goal, the research was carried out in two stages. The first consisted in the development of a corpus of song lyrics for training and/or fine tuning of learning models. The second step consisted of adjusting a pre-trained model for song lyrics generation. The research results generated evidence for the adopted approach, showing that it is a possible promising path for this type of task. Keywords: Natural language processing. Text generation. Lyrics.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaCiência da ComputaçãoProcessamento de linguagem natural (Computação)Transmissão textualComposição musical por computadorSistemas de coleta automática de dadosCiência da ComputaçãoDesenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinadosCorpora development and lyrics generation using pre-trained modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2021-07-06Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1137956https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdfe8ed494f23857d48e625752388851ea9MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29684/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296842023-03-03 15:23:36.628oai:locus.ufv.br:123456789/29684Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-03T18:23:36LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.pt-BR.fl_str_mv |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
dc.title.en.fl_str_mv |
Corpora development and lyrics generation using pre-trained models |
title |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
spellingShingle |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados Rodrigues, Matheus Augusto Gonzaga Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados Ciência da Computação |
title_short |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
title_full |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
title_fullStr |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
title_full_unstemmed |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
title_sort |
Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados |
author |
Rodrigues, Matheus Augusto Gonzaga |
author_facet |
Rodrigues, Matheus Augusto Gonzaga |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/9263099563741253 |
dc.contributor.author.fl_str_mv |
Rodrigues, Matheus Augusto Gonzaga |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Alcione de Paiva |
contributor_str_mv |
Oliveira, Alcione de Paiva |
dc.subject.pt-BR.fl_str_mv |
Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados |
topic |
Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados Ciência da Computação |
dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
description |
O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música. |
publishDate |
2021 |
dc.date.issued.fl_str_mv |
2021-07-06 |
dc.date.accessioned.fl_str_mv |
2022-08-16T18:42:52Z |
dc.date.available.fl_str_mv |
2022-08-16T18:42:52Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021. |
dc.identifier.uri.fl_str_mv |
https://locus.ufv.br//handle/123456789/29684 |
dc.identifier.doi.pt-BR.fl_str_mv |
https://doi.org/10.47328/ufvbbt.2021.015 |
identifier_str_mv |
RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021. |
url |
https://locus.ufv.br//handle/123456789/29684 https://doi.org/10.47328/ufvbbt.2021.015 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/29684/2/license.txt |
bitstream.checksum.fl_str_mv |
e8ed494f23857d48e625752388851ea9 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213064776777728 |