MERGE Áudio 2.0

Detalhes bibliográficos
Autor(a) principal: Louro, Pedro Miguel Lima
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/102155
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
id RCAP_352cfbc9f01540404bdf6c9f746bc5b5
oai_identifier_str oai:estudogeral.uc.pt:10316/102155
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling MERGE Áudio 2.0MERGE Audio 2.0Recuperação de Informação em MúsicaReconhecimento de Emoção em MúsicaAprendizagem ComputacionalAprendizagem ProfundaSintetização de DadosMusic Information RetrievalMusic Emotion RecognitionMachine LearningDeep LearningData AugmentationDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaA biblioteca de musical disponível digitalmente aos consumidores levou ao crescimante do campo científico de Recoonhecimento de Emoção em Música, devido à necissidade de organizar estas enormes coleções e prestar recomendações personalizadas para os ouvintes. A infância deste campo é dominada por metodologias de Aprendizagem Computacional Clássica utilizando elementos cuidadosamente desenhados para identificar as emoções percecionadas em peças musicais. Recentemente, registou-se um aumento de metodologias de Apredizagem Profunda no campo devido à sua abilidade de extrair elementos relevantes nestas peças, tornando o passo de desenhar elementos automático.Este trabalho contribuí para o campo oferecendo um conjunto alargado de experiências utilizando diversas metodologias avaliadas em dois conjuntos de dados: o conjunto de dados 4 Quadrant Audio Emotion Dataset (4QAED), previamente desenvolvido pela nossa equipa, e a sua extensão, cujos resultados são comparados de forma a estudar o impacto na performance.Obtivemos resultados acima do estado da arte. Nomeadamente, um F1 Score de 80.24\% utilizando um modelo híbrido, constituído por uma Rede Neuronal Convolucional, pré-treinado em amostras sintetizadas a partir de técnias de sintetização de dados áudio, uma Rede Neuronal Densa, pré-treinada em elementos extraídos desenhados à mão.O trabalho desenvolvido deu também alguma , incluindo continuar a explorar metodologias que utilizam Sintetização de Dados and utilizar a informação de múltiplas representações espectrais para lidar com o número reduzido de amostras disponíveis nos conjuntos de dados no estado da arte.The library of digital music available to consumers has pushed for the growth of the Music Emotion Recognition research field, due to the need of organizing these large collections and provide personalized recommendations to listeners. The infancy of this field is dominated by Classical Machine Learning approaches using carefully constructed features to identify the perceived emotions of music pieces. Recently, there has been an increase in Deep Learning approaches in the field due to the ability of extracting the underlying features in the pieces, making the feature design step of the previous approaches automatic.This work thus contributes to the field by providing an extensive set of experiments using a variety of approaches conducted on two datasets: the 4 Quadrant Audio Emotion Dataset (4QAED) dataset, previously developed by our team, and its extension, whose results are compared against for studying the impact in performance. We obtained results above the state-of-the-art. Namely, a 80.24\% F1 Score using an hybrid model, comprised of a Convolutional Neural Network, pre-trained on augmentated samples obtained using classical audio augmentation techniques, and a Dense Neural Network, pre-trained on extracted handcrafted features.The developed worked also gave some insight in some promising directions, include further exploring Data Augmentation approaches and leveraging the information from multiple spectral representation to deal with the low amount of samples available in current state of the art datasets.FCT2022-09-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/102155http://hdl.handle.net/10316/102155TID:203062582engLouro, Pedro Miguel Limainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-10-11T16:23:35Zoai:estudogeral.uc.pt:10316/102155Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:19:12.624009Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv MERGE Áudio 2.0
MERGE Audio 2.0
title MERGE Áudio 2.0
spellingShingle MERGE Áudio 2.0
Louro, Pedro Miguel Lima
Recuperação de Informação em Música
Reconhecimento de Emoção em Música
Aprendizagem Computacional
Aprendizagem Profunda
Sintetização de Dados
Music Information Retrieval
Music Emotion Recognition
Machine Learning
Deep Learning
Data Augmentation
title_short MERGE Áudio 2.0
title_full MERGE Áudio 2.0
title_fullStr MERGE Áudio 2.0
title_full_unstemmed MERGE Áudio 2.0
title_sort MERGE Áudio 2.0
author Louro, Pedro Miguel Lima
author_facet Louro, Pedro Miguel Lima
author_role author
dc.contributor.author.fl_str_mv Louro, Pedro Miguel Lima
dc.subject.por.fl_str_mv Recuperação de Informação em Música
Reconhecimento de Emoção em Música
Aprendizagem Computacional
Aprendizagem Profunda
Sintetização de Dados
Music Information Retrieval
Music Emotion Recognition
Machine Learning
Deep Learning
Data Augmentation
topic Recuperação de Informação em Música
Reconhecimento de Emoção em Música
Aprendizagem Computacional
Aprendizagem Profunda
Sintetização de Dados
Music Information Retrieval
Music Emotion Recognition
Machine Learning
Deep Learning
Data Augmentation
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
publishDate 2022
dc.date.none.fl_str_mv 2022-09-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/102155
http://hdl.handle.net/10316/102155
TID:203062582
url http://hdl.handle.net/10316/102155
identifier_str_mv TID:203062582
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134086326910976