Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Matheus Augusto Gonzaga
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: LOCUS Repositório Institucional da UFV
Texto Completo: https://locus.ufv.br//handle/123456789/29684
https://doi.org/10.47328/ufvbbt.2021.015
Resumo: O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.
id UFV_b577b8062d8ef832dcfed96cb92b6f36
oai_identifier_str oai:locus.ufv.br:123456789/29684
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str 2145
spelling Rodrigues, Matheus Augusto Gonzagahttp://lattes.cnpq.br/9263099563741253Oliveira, Alcione de Paiva2022-08-16T18:42:52Z2022-08-16T18:42:52Z2021-07-06RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.https://locus.ufv.br//handle/123456789/29684https://doi.org/10.47328/ufvbbt.2021.015O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.The field of natural language generation consists in the creation of texts that provide information contained in other types of sources (numerical data, graphics, taxonomies and ontologies or even other texts), in order to make these texts indistinguishable, as far as possible, of those created by humans. The automatic generation of text makes it possible to increase the production of textual material that can have different purposes, such as the production of teaching material, production of technical manuals, assistance in the production of scientific dissemination material, automatic generation of advertisement, etc. Within the scope of this task, the textual genre "song lyrics" stands out, characterized by its structure (structured in verses that are grouped into stanzas), by having rhyme and rhythm, and by being able to arouse emotions, once that the genre belongs to the artistic domain. Due to these characteristics, musical text production presents additional challenges compared to text production in general. The automatic generation of song lyrics can help artists in their compositions, reducing the time spent writing songs and promoting music production. The purpose of this research is to verify the feasibility of generating musical texts through the most recent models of deep learning. To achieve this goal, the research was carried out in two stages. The first consisted in the development of a corpus of song lyrics for training and/or fine tuning of learning models. The second step consisted of adjusting a pre-trained model for song lyrics generation. The research results generated evidence for the adopted approach, showing that it is a possible promising path for this type of task. Keywords: Natural language processing. Text generation. Lyrics.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaCiência da ComputaçãoProcessamento de linguagem natural (Computação)Transmissão textualComposição musical por computadorSistemas de coleta automática de dadosCiência da ComputaçãoDesenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinadosCorpora development and lyrics generation using pre-trained modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2021-07-06Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1137956https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdfe8ed494f23857d48e625752388851ea9MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29684/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296842023-03-03 15:23:36.628oai:locus.ufv.br:123456789/29684Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-03T18:23:36LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.pt-BR.fl_str_mv Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
dc.title.en.fl_str_mv Corpora development and lyrics generation using pre-trained models
title Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
spellingShingle Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
Rodrigues, Matheus Augusto Gonzaga
Processamento de linguagem natural (Computação)
Transmissão textual
Composição musical por computador
Sistemas de coleta automática de dados
Ciência da Computação
title_short Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_full Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_fullStr Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_full_unstemmed Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_sort Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
author Rodrigues, Matheus Augusto Gonzaga
author_facet Rodrigues, Matheus Augusto Gonzaga
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/9263099563741253
dc.contributor.author.fl_str_mv Rodrigues, Matheus Augusto Gonzaga
dc.contributor.advisor1.fl_str_mv Oliveira, Alcione de Paiva
contributor_str_mv Oliveira, Alcione de Paiva
dc.subject.pt-BR.fl_str_mv Processamento de linguagem natural (Computação)
Transmissão textual
Composição musical por computador
Sistemas de coleta automática de dados
topic Processamento de linguagem natural (Computação)
Transmissão textual
Composição musical por computador
Sistemas de coleta automática de dados
Ciência da Computação
dc.subject.cnpq.fl_str_mv Ciência da Computação
description O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.
publishDate 2021
dc.date.issued.fl_str_mv 2021-07-06
dc.date.accessioned.fl_str_mv 2022-08-16T18:42:52Z
dc.date.available.fl_str_mv 2022-08-16T18:42:52Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
dc.identifier.uri.fl_str_mv https://locus.ufv.br//handle/123456789/29684
dc.identifier.doi.pt-BR.fl_str_mv https://doi.org/10.47328/ufvbbt.2021.015
identifier_str_mv RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
url https://locus.ufv.br//handle/123456789/29684
https://doi.org/10.47328/ufvbbt.2021.015
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/29684/2/license.txt
bitstream.checksum.fl_str_mv e8ed494f23857d48e625752388851ea9
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1801213064776777728