Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais

Santos, Leonardo Brito dos; Jorge, Renan Henrique Azevedo

Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais

Detalhes bibliográficos
Autor(a) principal:	Santos, Leonardo Brito dos
Data de Publicação:	2023
Outros Autores:	Jorge, Renan Henrique Azevedo
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo:	http://app.uff.br/riuff/handle/1/30592
Resumo:	Cada vez mais se ouve falar no conceito de Big Data, isso esta acontecendo devido ao constante crescimento de dados gerados no meio digital. Por conta do aumento de interesse sobre Big Data surgiram varias ferramentas que auxiliam no processamento de dados em larga escala, utilizando paralelismo como forma de acelerar a entrega dos resultados, isso possibilita o processamento em tempo real, sendo assim, decisões críticas podem ser tomadas com maior antecedência. Neste trabalho de conclusão de curso, temos como objetivo estudar duas dessas ferramentas utilizadas para projetos de Big Data, o Hadoop MapReduce e o Apache Spark, onde serão apontadas as características de cada uma comparando as duas por meio do experimento de classificação de gêneros musicais, utilizando características extraídas do áudio a partir das prévias fornecidas pelo serviço de streaming Spotify. No nosso conjunto de dados, foram coletadas, aproximadamente, 400 mil musicas, distribuídas entre os 5 gêneros musicais mais populares: rock, pop, clássica, eletrônica e jazz. Através dos experimentos realizados constatou-se que a ferramenta Apache Spark obteve resultados superiores comparado com o Hadoop MapReduce em relação ao tempo de execução e a acurácia. A partir dos resultados também foi possível enxergar estudos futuros dessas ferramentas, utilizando novas formas de processamento e ambientes de execução

Metadados do item

id	UFF-2_2fc680b76d72af4cd43ec3c127b2849a
oai_identifier_str	oai:app.uff.br:1/30592
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str	2120
spelling	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicaisBig DataClassificação de gêneros musicaisHadoop MapReduceSparkBig DataProcessamento de dados (Computação)Gênero musicalMusical genre classificationCada vez mais se ouve falar no conceito de Big Data, isso esta acontecendo devido ao constante crescimento de dados gerados no meio digital. Por conta do aumento de interesse sobre Big Data surgiram varias ferramentas que auxiliam no processamento de dados em larga escala, utilizando paralelismo como forma de acelerar a entrega dos resultados, isso possibilita o processamento em tempo real, sendo assim, decisões críticas podem ser tomadas com maior antecedência. Neste trabalho de conclusão de curso, temos como objetivo estudar duas dessas ferramentas utilizadas para projetos de Big Data, o Hadoop MapReduce e o Apache Spark, onde serão apontadas as características de cada uma comparando as duas por meio do experimento de classificação de gêneros musicais, utilizando características extraídas do áudio a partir das prévias fornecidas pelo serviço de streaming Spotify. No nosso conjunto de dados, foram coletadas, aproximadamente, 400 mil musicas, distribuídas entre os 5 gêneros musicais mais populares: rock, pop, clássica, eletrônica e jazz. Através dos experimentos realizados constatou-se que a ferramenta Apache Spark obteve resultados superiores comparado com o Hadoop MapReduce em relação ao tempo de execução e a acurácia. A partir dos resultados também foi possível enxergar estudos futuros dessas ferramentas, utilizando novas formas de processamento e ambientes de execuçãoMore and more we hear about the concept of Big Data, this is happening due to the constant growth of data generated in the digital environment. Due to increased interest on Big Data, several tools have emerged to help large scale data processing, using parallelism as a way of accelerating results delivery, and enabling real time processing, because of that critical decision can be taken in advance. In this dissertation, we aim to study two tools used for Big Data projects, the Hadoop MapReduce and the Apache Spark, we will point out the main characteristics of each tool, comparing both by a musical genre classification experiment, using characteristics extracted from the audio provided by the streaming service Spotify. On our dataset were collected approximately 400 thousand songs, distributed on the five most popular music genres: rock, pop, classic, electronic and jazz. Through the experiments that were made we verified that the tool Apache Spark have obtained better results than Hadoop MapReduce in relation to the execution time and acuracy of the classification. From the results it was also possible to see future studies of these tools, using new forms of processing and execution environments49 p.Passos, Fernanda G. O.Passos, DiegoNascimento, AlineSantos, Leonardo Brito dosJorge, Renan Henrique Azevedo2023-09-26T14:07:02Z2023-09-26T14:07:02Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSANTOS, Leonardo Brito dos; JORGE, Renan Henrique Azevedo. Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais. 2018. 49 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2018.http://app.uff.br/riuff/handle/1/30592CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2023-09-26T14:07:06Zoai:app.uff.br:1/30592Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:00:02.112129Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
title	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
spellingShingle	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais Santos, Leonardo Brito dos Big Data Classificação de gêneros musicais Hadoop MapReduce Spark Big Data Processamento de dados (Computação) Gênero musical Musical genre classification
title_short	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
title_full	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
title_fullStr	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
title_full_unstemmed	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
title_sort	Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais
author	Santos, Leonardo Brito dos
author_facet	Santos, Leonardo Brito dos Jorge, Renan Henrique Azevedo
author_role	author
author2	Jorge, Renan Henrique Azevedo
author2_role	author
dc.contributor.none.fl_str_mv	Passos, Fernanda G. O. Passos, Diego Nascimento, Aline
dc.contributor.author.fl_str_mv	Santos, Leonardo Brito dos Jorge, Renan Henrique Azevedo
dc.subject.por.fl_str_mv	Big Data Classificação de gêneros musicais Hadoop MapReduce Spark Big Data Processamento de dados (Computação) Gênero musical Musical genre classification
topic	Big Data Classificação de gêneros musicais Hadoop MapReduce Spark Big Data Processamento de dados (Computação) Gênero musical Musical genre classification
description	Cada vez mais se ouve falar no conceito de Big Data, isso esta acontecendo devido ao constante crescimento de dados gerados no meio digital. Por conta do aumento de interesse sobre Big Data surgiram varias ferramentas que auxiliam no processamento de dados em larga escala, utilizando paralelismo como forma de acelerar a entrega dos resultados, isso possibilita o processamento em tempo real, sendo assim, decisões críticas podem ser tomadas com maior antecedência. Neste trabalho de conclusão de curso, temos como objetivo estudar duas dessas ferramentas utilizadas para projetos de Big Data, o Hadoop MapReduce e o Apache Spark, onde serão apontadas as características de cada uma comparando as duas por meio do experimento de classificação de gêneros musicais, utilizando características extraídas do áudio a partir das prévias fornecidas pelo serviço de streaming Spotify. No nosso conjunto de dados, foram coletadas, aproximadamente, 400 mil musicas, distribuídas entre os 5 gêneros musicais mais populares: rock, pop, clássica, eletrônica e jazz. Através dos experimentos realizados constatou-se que a ferramenta Apache Spark obteve resultados superiores comparado com o Hadoop MapReduce em relação ao tempo de execução e a acurácia. A partir dos resultados também foi possível enxergar estudos futuros dessas ferramentas, utilizando novas formas de processamento e ambientes de execução
publishDate	2023
dc.date.none.fl_str_mv	2023-09-26T14:07:02Z 2023-09-26T14:07:02Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	SANTOS, Leonardo Brito dos; JORGE, Renan Henrique Azevedo. Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais. 2018. 49 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2018. http://app.uff.br/riuff/handle/1/30592
identifier_str_mv	SANTOS, Leonardo Brito dos; JORGE, Renan Henrique Azevedo. Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais. 2018. 49 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Instituto de Computação, Universidade Federal Fluminense, Niterói, 2018.
url	http://app.uff.br/riuff/handle/1/30592
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1811823631894839296

Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais

Registros relacionados