Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental

Detalhes bibliográficos
Autor(a) principal: LUIZ HENRIQUE DA SILVA SANTOS
Data de Publicação: 2023
Outros Autores: MATHEUS VYCTOR ARANDA ESPÍNDOLA
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFMS
Texto Completo: https://repositorio.ufms.br/handle/123456789/6170
Resumo: Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.
id UFMS_d249c61599c22039b32adc44c36d0495
oai_identifier_str oai:repositorio.ufms.br:123456789/6170
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str 2124
spelling 2023-07-03T13:23:19Z2023-07-03T13:23:19Z2023https://repositorio.ufms.br/handle/123456789/6170Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.Aprendizado Incremental lida com um aumento contínuo no número de classes ao longo do tempo. O principal problema nesse contexto é o "esquecimento catastrófico", em que os modelos perdem a capacidade de resolver as tarefas originalmente aprendidas ao serem treinados para novas tarefas; além da necessidade de cada vez mais recursos computacionais conforme novos treinos acontençam. Para contornar esse problema a proposta avalia o uso de modelos de Aprendizado Profundo de Métricas juntamente com técnicas de Seleção de Instâncias no conjunto de dados CIFAR-100. Na valiação experimental os embeddings foram avaliados com K-Nearest Neighbor para análise de desempenho. O modelo EfficientNetV2 Small foi escolhido como backbone. Para gerar representações numéricas de alta dimensionalidade que refletem a similaridade entre as classes foi treinado um modelo de Aprendizado Profundo de Métricas, chamado Zero-shot. Em seguida, o fine-tuning do modelo Zero-shot foi realizado para aprender novas classes adicionadas ao conjunto de dados original. Para garantir que o modelo não esquecesse as classes antigas, técnicas de Seleção de Instâncias foram utilizadas, como o Random Mutation Hill Climbing (RMHC) e o Gaussian Mixture (GM). O intuito é selecionar instâncias representativas das classes antigas e reduzir ruídos. O resultado obtido obteve uma acurácia de 78,80% para o conjunto de dados original (Tarefa 1), e uma acurácia de 82,00% para o conjunto com novas classes (Tarefa 2). Comparado com o modelo Baseline, houve uma redução de 9,33% para a Tarefa 1 -- a qual o modelo Proposto foi inicialmente treinado -- e um aumento em 2,12% de acurácia para a Tarefa 2. Já a quantidade de instâncias necessárias para o treino do modelo Proposto foi 81,00% menor do que o modelo Baseline, e a quantidade de épocas foi 87,50% menor. Dessa forma, o estudo propõem um treino rápido com tamanho limitado do conjunto de treino que evita o "esquecimento catastrófico" das classes antigas.Fundação Universidade Federal de Mato Grosso do SulUFMSCiências Exatas e da TerraAprendizado de MétricaSeleção de InstânciasAprendizado de MáquinaAprendizado IncrementalAprendizado Profundo.Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incrementalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisEDSON TAKASHI MATSUBARALUIZ HENRIQUE DA SILVA SANTOSMATHEUS VYCTOR ARANDA ESPÍNDOLAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSORIGINAL1900.pdf1900.pdfapplication/pdf301990https://repositorio.ufms.br/bitstream/123456789/6170/-1/1900.pdf8522c5e82836fa8692ba399758e39496MD5-1123456789/61702023-07-03 09:23:19.954oai:repositorio.ufms.br:123456789/6170Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242023-07-03T13:23:19Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
spellingShingle Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
LUIZ HENRIQUE DA SILVA SANTOS
Aprendizado de Métrica
Seleção de Instâncias
Aprendizado de Máquina
Aprendizado Incremental
Aprendizado Profundo.
Ciências Exatas e da Terra
title_short Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_full Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_fullStr Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_full_unstemmed Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_sort Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
author LUIZ HENRIQUE DA SILVA SANTOS
author_facet LUIZ HENRIQUE DA SILVA SANTOS
MATHEUS VYCTOR ARANDA ESPÍNDOLA
author_role author
author2 MATHEUS VYCTOR ARANDA ESPÍNDOLA
author2_role author
dc.contributor.advisor1.fl_str_mv EDSON TAKASHI MATSUBARA
dc.contributor.author.fl_str_mv LUIZ HENRIQUE DA SILVA SANTOS
MATHEUS VYCTOR ARANDA ESPÍNDOLA
contributor_str_mv EDSON TAKASHI MATSUBARA
dc.subject.por.fl_str_mv Aprendizado de Métrica
Seleção de Instâncias
Aprendizado de Máquina
Aprendizado Incremental
Aprendizado Profundo.
topic Aprendizado de Métrica
Seleção de Instâncias
Aprendizado de Máquina
Aprendizado Incremental
Aprendizado Profundo.
Ciências Exatas e da Terra
dc.subject.classification.pt_BR.fl_str_mv Ciências Exatas e da Terra
description Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-03T13:23:19Z
dc.date.available.fl_str_mv 2023-07-03T13:23:19Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/6170
url https://repositorio.ufms.br/handle/123456789/6170
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.publisher.initials.fl_str_mv UFMS
dc.publisher.country.pt_BR.fl_str_mv
publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/6170/-1/1900.pdf
bitstream.checksum.fl_str_mv 8522c5e82836fa8692ba399758e39496
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1801678550801055744