Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFG |
dARK ID: | ark:/38995/00130000091cd |
Texto Completo: | http://repositorio.bc.ufg.br/tede/handle/tede/11387 |
Resumo: | This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained. |
id |
UFG-2_0a7506f21041b9a40c755d887ddc2d0f |
---|---|
oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/11387 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
|
spelling |
Lemos, Rodrigo Pintohttp://lattes.cnpq.br/3333000136853156Lemos, Rodrigo PintoVieira, Flávio Henrique TelesCalixto, Wesley PachecoAlmeida, Anselmo Guerra dehttp://lattes.cnpq.br/5924224953025095Bertoni, André Augusto2021-05-26T11:27:23Z2021-05-26T11:27:23Z2021-04-13BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.http://repositorio.bc.ufg.br/tede/handle/tede/11387ark:/38995/00130000091cdThis work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.Este trabalho tem por intuito desenvolver algoritmos capazes de prever se uma canção popular brasileira pode se tornar um sucesso comercial, utilizando-se do auxílio de técnicas de Aprendizado de Máquina. Para alcançar este objetivo, foi criado um banco de canções populares brasileiras executadas nas rádios no período de 2014 a 2019, aplicando-se o número de execuções em rádios como o critério para separação das canções em um grupo de sucesso e noutro de canções de não-sucesso. Foram estudadas e aplicadas diversas técnicas de Análise de Dados (Data Analytics) para otimizar os bancos de dados e extrair características estatísticas das canções. A partir do estudo de teoria musical, definiu-se também um conjunto de características semânticas musicais extraídas de cada canção para subsidiar os algoritmos de Aprendizado de Máquina, para, em seguida, empregar-se técnicas de Ciência de Dados (Data Science) para prever se uma canção pode se tornar um sucesso comercial. Utilizaram-se algoritmos de classificação com treinamento supervisionado, tanto por abordagem clássica quanto por meio de Redes Neurais Profundas. Para treinamento e validação, empregou-se validação cruzada com dez subconjuntos para a abordagem com técnicas clássicas, e cinco subconjuntos para as redes convolucionais. Os desempenhos dos algoritmos foram comparados basicamente em termos de acurácia, precisão, sensibilidade e especificidade. A discussão dos resultados deste trabalho demonstrou que características estatísticas extraídas das canções trouxeram resultados satisfatórios em várias métricas, como: Acurácia (69,63%), Precisão: (69,03%), Sensibilidade (71,55%), Acurácia Balanceada (69,75%) e ROC (69,75%), utilizando-se Técnicas Clássicas, como: Naive Bayes, Árvore de Decisões, Floresta Aleatória, kNN, Regressão Logística, Máquina de Vetores de Suporte (SVM) e Multi Layer Perceptron (MLP) - o que representa um excelente resultado, quando comparado à vários outros trabalhos da literatura. As Redes Neurais Profundas do tipo Convolucionais não trouxeram bons resultados, com acurácia pouco melhor do que um sorteio aleatório. O melhor cenário foi conseguido através da junção de três bancos distintos de características: a) estatísticas; b) espectrográficas extraídas da Melodia Principal da Voz; c) informações Semânticas Melódicas Musicais. Com a junção destes três bancos distintos de características obteve-se 74,54% de Precisão.Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-20T11:13:32Z No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-26T11:27:23Z (GMT) No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Made available in DSpace on 2021-05-26T11:27:23Z (GMT). No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-04-13porUniversidade Federal de GoiásPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)UFGBrasilEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessCiência das canções de sucessoAprendizado de máquinaExtração de característicasRecuperação de Informações Musicais (RIM)Melodia predominante da vozHit song scienceMachine learningFeature extractionMusic Information Retrieval (MIR)Predominant voice melodyENGENHARIASAvaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquinaCharacteristics evaluation and prediction of success of popular brazilian songs through machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis495005005004484reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/9d4b4a04-7391-4384-b363-6b2c1bcfc2ff/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - André Augusto Bertoni - 2021.pdfDissertação - André Augusto Bertoni - 2021.pdfapplication/pdf7829360http://repositorio.bc.ufg.br/tede/bitstreams/dcab41d7-3830-4cb8-a15c-f84856d09d84/downloada6a485f477a277e9b0abdaf71ab176c3MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/9f7b169d-b8a9-4a9b-8274-e408c7d4fd1a/download4460e5956bc1d1639be9ae6146a50347MD52tede/113872021-05-26 08:27:23.937http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/11387http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2021-05-26T11:27:23Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
dc.title.pt_BR.fl_str_mv |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
dc.title.alternative.eng.fl_str_mv |
Characteristics evaluation and prediction of success of popular brazilian songs through machine learning |
title |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
spellingShingle |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina Bertoni, André Augusto Ciência das canções de sucesso Aprendizado de máquina Extração de características Recuperação de Informações Musicais (RIM) Melodia predominante da voz Hit song science Machine learning Feature extraction Music Information Retrieval (MIR) Predominant voice melody ENGENHARIAS |
title_short |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
title_full |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
title_fullStr |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
title_full_unstemmed |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
title_sort |
Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina |
author |
Bertoni, André Augusto |
author_facet |
Bertoni, André Augusto |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Lemos, Rodrigo Pinto |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3333000136853156 |
dc.contributor.referee1.fl_str_mv |
Lemos, Rodrigo Pinto |
dc.contributor.referee2.fl_str_mv |
Vieira, Flávio Henrique Teles |
dc.contributor.referee3.fl_str_mv |
Calixto, Wesley Pacheco |
dc.contributor.referee4.fl_str_mv |
Almeida, Anselmo Guerra de |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5924224953025095 |
dc.contributor.author.fl_str_mv |
Bertoni, André Augusto |
contributor_str_mv |
Lemos, Rodrigo Pinto Lemos, Rodrigo Pinto Vieira, Flávio Henrique Teles Calixto, Wesley Pacheco Almeida, Anselmo Guerra de |
dc.subject.por.fl_str_mv |
Ciência das canções de sucesso Aprendizado de máquina Extração de características Recuperação de Informações Musicais (RIM) Melodia predominante da voz |
topic |
Ciência das canções de sucesso Aprendizado de máquina Extração de características Recuperação de Informações Musicais (RIM) Melodia predominante da voz Hit song science Machine learning Feature extraction Music Information Retrieval (MIR) Predominant voice melody ENGENHARIAS |
dc.subject.eng.fl_str_mv |
Hit song science Machine learning Feature extraction Music Information Retrieval (MIR) Predominant voice melody |
dc.subject.cnpq.fl_str_mv |
ENGENHARIAS |
description |
This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-05-26T11:27:23Z |
dc.date.available.fl_str_mv |
2021-05-26T11:27:23Z |
dc.date.issued.fl_str_mv |
2021-04-13 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021. |
dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/11387 |
dc.identifier.dark.fl_str_mv |
ark:/38995/00130000091cd |
identifier_str_mv |
BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021. ark:/38995/00130000091cd |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/11387 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
49 |
dc.relation.confidence.fl_str_mv |
500 500 500 |
dc.relation.department.fl_str_mv |
4 |
dc.relation.cnpq.fl_str_mv |
484 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC) |
dc.publisher.initials.fl_str_mv |
UFG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG) |
publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/9d4b4a04-7391-4384-b363-6b2c1bcfc2ff/download http://repositorio.bc.ufg.br/tede/bitstreams/dcab41d7-3830-4cb8-a15c-f84856d09d84/download http://repositorio.bc.ufg.br/tede/bitstreams/9f7b169d-b8a9-4a9b-8274-e408c7d4fd1a/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 a6a485f477a277e9b0abdaf71ab176c3 4460e5956bc1d1639be9ae6146a50347 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
tasesdissertacoes.bc@ufg.br |
_version_ |
1815172606626627584 |