Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados

Rodrigues, Matheus Augusto Gonzaga

Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados

Detalhes bibliográficos
Autor(a) principal:	Rodrigues, Matheus Augusto Gonzaga
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	LOCUS Repositório Institucional da UFV
Texto Completo:	https://locus.ufv.br//handle/123456789/29684 https://doi.org/10.47328/ufvbbt.2021.015
Resumo:	O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.

Metadados do item

id	UFV_b577b8062d8ef832dcfed96cb92b6f36
oai_identifier_str	oai:locus.ufv.br:123456789/29684
network_acronym_str	UFV
network_name_str	LOCUS Repositório Institucional da UFV
repository_id_str	2145
spelling	Rodrigues, Matheus Augusto Gonzagahttp://lattes.cnpq.br/9263099563741253Oliveira, Alcione de Paiva2022-08-16T18:42:52Z2022-08-16T18:42:52Z2021-07-06RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.https://locus.ufv.br//handle/123456789/29684https://doi.org/10.47328/ufvbbt.2021.015O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.The field of natural language generation consists in the creation of texts that provide information contained in other types of sources (numerical data, graphics, taxonomies and ontologies or even other texts), in order to make these texts indistinguishable, as far as possible, of those created by humans. The automatic generation of text makes it possible to increase the production of textual material that can have different purposes, such as the production of teaching material, production of technical manuals, assistance in the production of scientific dissemination material, automatic generation of advertisement, etc. Within the scope of this task, the textual genre "song lyrics" stands out, characterized by its structure (structured in verses that are grouped into stanzas), by having rhyme and rhythm, and by being able to arouse emotions, once that the genre belongs to the artistic domain. Due to these characteristics, musical text production presents additional challenges compared to text production in general. The automatic generation of song lyrics can help artists in their compositions, reducing the time spent writing songs and promoting music production. The purpose of this research is to verify the feasibility of generating musical texts through the most recent models of deep learning. To achieve this goal, the research was carried out in two stages. The first consisted in the development of a corpus of song lyrics for training and/or fine tuning of learning models. The second step consisted of adjusting a pre-trained model for song lyrics generation. The research results generated evidence for the adopted approach, showing that it is a possible promising path for this type of task. Keywords: Natural language processing. Text generation. Lyrics.Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaCiência da ComputaçãoProcessamento de linguagem natural (Computação)Transmissão textualComposição musical por computadorSistemas de coleta automática de dadosCiência da ComputaçãoDesenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinadosCorpora development and lyrics generation using pre-trained modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de InformáticaMestre em Ciência da ComputaçãoViçosa - MG2021-07-06Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1137956https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdfe8ed494f23857d48e625752388851ea9MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29684/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/296842023-03-03 15:23:36.628oai:locus.ufv.br:123456789/29684Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-03-03T18:23:36LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.pt-BR.fl_str_mv	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
dc.title.en.fl_str_mv	Corpora development and lyrics generation using pre-trained models
title	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
spellingShingle	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados Rodrigues, Matheus Augusto Gonzaga Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados Ciência da Computação
title_short	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_full	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_fullStr	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_full_unstemmed	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
title_sort	Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados
author	Rodrigues, Matheus Augusto Gonzaga
author_facet	Rodrigues, Matheus Augusto Gonzaga
author_role	author
dc.contributor.authorLattes.pt-BR.fl_str_mv	http://lattes.cnpq.br/9263099563741253
dc.contributor.author.fl_str_mv	Rodrigues, Matheus Augusto Gonzaga
dc.contributor.advisor1.fl_str_mv	Oliveira, Alcione de Paiva
contributor_str_mv	Oliveira, Alcione de Paiva
dc.subject.pt-BR.fl_str_mv	Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados
topic	Processamento de linguagem natural (Computação) Transmissão textual Composição musical por computador Sistemas de coleta automática de dados Ciência da Computação
dc.subject.cnpq.fl_str_mv	Ciência da Computação
description	O campo de geração de linguagem natural consiste na criação de textos que fornecem informações contidas em outros tipos de fontes (dados numéricos, gráficos, taxonomias e ontologias ou mesmo outros textos), com o objetivo de tornar esses textos indistinguíveis, na medida do possível, daqueles criados por humanos. A geração automática de texto possibilita o aumento da produção de material textual que pode ter diversas finalidades, tais como, produção de material didático, produção de manuais técnicos, auxílio na produção de material de divulgação científica, geração automática de propaganda etc. Dentro do escopo desta tarefa, destaca-se o gênero textual “letra de canção” que se caracteriza por sua estrutura (estruturada em versos que se agrupam em estrofes), por possuir rima e ritmo, e por ser capaz de despertar emoções, visto que o gênero pertence ao domínio artístico. Devido a essas características, a produção de texto musical apresenta desafios adicionais em relação à produção de textos em geral. A geração de letras de canções de forma automática pode auxiliar artistas em suas composições, reduzindo o tempo gasto na escrita de músicas e fomentando a produção musical. A proposta desta pesquisa é verificar a viabilidade da geração de texto musical por meio dos modelos mais recentes de aprendizado profundo. Para atingir esse objetivo a pesquisa foi realizada em duas etapas. A primeira consistiu no desenvolvimento de um corpus de letras de música para treinamento e/ou fine tuning de modelos de aprendizado. A segunda etapa consistiu no ajuste de um modelo pré-treinado para geração de letras de música. O resultado da pesquisa gerou evidências para a abordagem adotada, mostrando que é possível caminho promissor para este tipo de tarefa. Palavras-chave: Processamento de linguagem natural. Geração de texto. Letras de música.
publishDate	2021
dc.date.issued.fl_str_mv	2021-07-06
dc.date.accessioned.fl_str_mv	2022-08-16T18:42:52Z
dc.date.available.fl_str_mv	2022-08-16T18:42:52Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
dc.identifier.uri.fl_str_mv	https://locus.ufv.br//handle/123456789/29684
dc.identifier.doi.pt-BR.fl_str_mv	https://doi.org/10.47328/ufvbbt.2021.015
identifier_str_mv	RODRIGUES, Matheus Augusto Gonzaga. Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados. 2021. 42 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
url	https://locus.ufv.br//handle/123456789/29684 https://doi.org/10.47328/ufvbbt.2021.015
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv	Ciência da Computação
publisher.none.fl_str_mv	Universidade Federal de Viçosa
dc.source.none.fl_str_mv	reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV
instname_str	Universidade Federal de Viçosa (UFV)
instacron_str	UFV
institution	UFV
reponame_str	LOCUS Repositório Institucional da UFV
collection	LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv	https://locus.ufv.br//bitstream/123456789/29684/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/29684/2/license.txt
bitstream.checksum.fl_str_mv	e8ed494f23857d48e625752388851ea9 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv	fabiojreis@ufv.br
_version_	1801213064776777728

Desenvolvimento de corpora e geração de letras de música utilizando modelos pré-treinados

Registros relacionados