Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental

LUIZ HENRIQUE DA SILVA SANTOS; MATHEUS VYCTOR ARANDA ESPÍNDOLA

Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental

Detalhes bibliográficos
Autor(a) principal:	LUIZ HENRIQUE DA SILVA SANTOS
Data de Publicação:	2023
Outros Autores:	MATHEUS VYCTOR ARANDA ESPÍNDOLA
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFMS
Texto Completo:	https://repositorio.ufms.br/handle/123456789/6170
Resumo:	Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.

Metadados do item

id	UFMS_d249c61599c22039b32adc44c36d0495
oai_identifier_str	oai:repositorio.ufms.br:123456789/6170
network_acronym_str	UFMS
network_name_str	Repositório Institucional da UFMS
repository_id_str	2124
spelling	2023-07-03T13:23:19Z2023-07-03T13:23:19Z2023https://repositorio.ufms.br/handle/123456789/6170Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.Aprendizado Incremental lida com um aumento contínuo no número de classes ao longo do tempo. O principal problema nesse contexto é o "esquecimento catastrófico", em que os modelos perdem a capacidade de resolver as tarefas originalmente aprendidas ao serem treinados para novas tarefas; além da necessidade de cada vez mais recursos computacionais conforme novos treinos acontençam. Para contornar esse problema a proposta avalia o uso de modelos de Aprendizado Profundo de Métricas juntamente com técnicas de Seleção de Instâncias no conjunto de dados CIFAR-100. Na valiação experimental os embeddings foram avaliados com K-Nearest Neighbor para análise de desempenho. O modelo EfficientNetV2 Small foi escolhido como backbone. Para gerar representações numéricas de alta dimensionalidade que refletem a similaridade entre as classes foi treinado um modelo de Aprendizado Profundo de Métricas, chamado Zero-shot. Em seguida, o fine-tuning do modelo Zero-shot foi realizado para aprender novas classes adicionadas ao conjunto de dados original. Para garantir que o modelo não esquecesse as classes antigas, técnicas de Seleção de Instâncias foram utilizadas, como o Random Mutation Hill Climbing (RMHC) e o Gaussian Mixture (GM). O intuito é selecionar instâncias representativas das classes antigas e reduzir ruídos. O resultado obtido obteve uma acurácia de 78,80% para o conjunto de dados original (Tarefa 1), e uma acurácia de 82,00% para o conjunto com novas classes (Tarefa 2). Comparado com o modelo Baseline, houve uma redução de 9,33% para a Tarefa 1 -- a qual o modelo Proposto foi inicialmente treinado -- e um aumento em 2,12% de acurácia para a Tarefa 2. Já a quantidade de instâncias necessárias para o treino do modelo Proposto foi 81,00% menor do que o modelo Baseline, e a quantidade de épocas foi 87,50% menor. Dessa forma, o estudo propõem um treino rápido com tamanho limitado do conjunto de treino que evita o "esquecimento catastrófico" das classes antigas.Fundação Universidade Federal de Mato Grosso do SulUFMSCiências Exatas e da TerraAprendizado de MétricaSeleção de InstânciasAprendizado de MáquinaAprendizado IncrementalAprendizado Profundo.Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incrementalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisEDSON TAKASHI MATSUBARALUIZ HENRIQUE DA SILVA SANTOSMATHEUS VYCTOR ARANDA ESPÍNDOLAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSORIGINAL1900.pdf1900.pdfapplication/pdf301990https://repositorio.ufms.br/bitstream/123456789/6170/-1/1900.pdf8522c5e82836fa8692ba399758e39496MD5-1123456789/61702023-07-03 09:23:19.954oai:repositorio.ufms.br:123456789/6170Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242023-07-03T13:23:19Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
spellingShingle	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental LUIZ HENRIQUE DA SILVA SANTOS Aprendizado de Métrica Seleção de Instâncias Aprendizado de Máquina Aprendizado Incremental Aprendizado Profundo. Ciências Exatas e da Terra
title_short	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_full	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_fullStr	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_full_unstemmed	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
title_sort	Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental
author	LUIZ HENRIQUE DA SILVA SANTOS
author_facet	LUIZ HENRIQUE DA SILVA SANTOS MATHEUS VYCTOR ARANDA ESPÍNDOLA
author_role	author
author2	MATHEUS VYCTOR ARANDA ESPÍNDOLA
author2_role	author
dc.contributor.advisor1.fl_str_mv	EDSON TAKASHI MATSUBARA
dc.contributor.author.fl_str_mv	LUIZ HENRIQUE DA SILVA SANTOS MATHEUS VYCTOR ARANDA ESPÍNDOLA
contributor_str_mv	EDSON TAKASHI MATSUBARA
dc.subject.por.fl_str_mv	Aprendizado de Métrica Seleção de Instâncias Aprendizado de Máquina Aprendizado Incremental Aprendizado Profundo.
topic	Aprendizado de Métrica Seleção de Instâncias Aprendizado de Máquina Aprendizado Incremental Aprendizado Profundo. Ciências Exatas e da Terra
dc.subject.classification.pt_BR.fl_str_mv	Ciências Exatas e da Terra
description	Incremental Learning deals with a continuous increase in the number of classes over time. The main problem in this context is "catastrophic forgetting," where models lose the ability to solve tasks they originally learned when trained for new tasks, along with the increasing need for computational resources as new training occurs. To address this problem, the proposal evaluates the use of Deep Metric Learning models along with Instance Selection techniques on the CIFAR-100 dataset. In the experimental evaluation, the embeddings were assessed using K-Nearest Neighbor for performance analysis. The EfficientNetV2 Small model was chosen as the backbone. To generate high-dimensional numerical representations reflecting the similarity between classes, a Deep Metric Learning model, Zero-shot, was trained. Subsequently, fine-tuning of the Zero-shot model was performed to learn new classes added to the original dataset. To ensure that the model did not forget the old classes, Instance Selection techniques were employed, such as Random Mutation Hill Climbing (RMHC) and Gaussian Mixture (GM). The goal was to select representative instances of the old classes and reduce noise. The obtained result achieved an accuracy of 78.80% for the original dataset (Task 1) and an accuracy of 82.00% for the dataset with new classes (Task 2). Compared to the Baseline model, there was a reduction of 9.33% for Task 1, for which the Proposed model was initially trained, and a 2.12% increase in accuracy for Task 2. Moreover, the Proposed model required 81.00% fewer instances for training compared to the Baseline model, and the number of epochs was reduced by 87.50%. Thus, the study proposes a fast training approach with a limited training set size that avoids "catastrophic forgetting" of old classes.
publishDate	2023
dc.date.accessioned.fl_str_mv	2023-07-03T13:23:19Z
dc.date.available.fl_str_mv	2023-07-03T13:23:19Z
dc.date.issued.fl_str_mv	2023
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ufms.br/handle/123456789/6170
url	https://repositorio.ufms.br/handle/123456789/6170
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Fundação Universidade Federal de Mato Grosso do Sul
dc.publisher.initials.fl_str_mv	UFMS
dc.publisher.country.pt_BR.fl_str_mv
publisher.none.fl_str_mv	Fundação Universidade Federal de Mato Grosso do Sul
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMS instname:Universidade Federal de Mato Grosso do Sul (UFMS) instacron:UFMS
instname_str	Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str	UFMS
institution	UFMS
reponame_str	Repositório Institucional da UFMS
collection	Repositório Institucional da UFMS
bitstream.url.fl_str_mv	https://repositorio.ufms.br/bitstream/123456789/6170/-1/1900.pdf
bitstream.checksum.fl_str_mv	8522c5e82836fa8692ba399758e39496
bitstream.checksumAlgorithm.fl_str_mv	MD5
repository.name.fl_str_mv	Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv	ri.prograd@ufms.br
_version_	1801678550801055744

Estudo de Seleção de Instâncias em Aprendizado de Métrica para o problema de classificação com Aprendizado Incremental

Registros relacionados