An evaluation of pre-trained models for feature extraction in image classification

Detalhes bibliográficos
Autor(a) principal: Puls, Erick da Silva
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: eng
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/261764
Resumo: Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas.
id UFRGS-2_63a314d407282143d6a102d871346e0c
oai_identifier_str oai:www.lume.ufrgs.br:10183/261764
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Puls, Erick da SilvaCarbonera, Joel Luis2023-07-05T03:46:46Z2023http://hdl.handle.net/10183/261764001172648Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas.In recent years, we have witnessed a considerable increase in performance in image clas sification tasks. This performance improvement is mainly due to the use of deep learning techniques. Generally, deep learning techniques demand a large set of annotated data, making it a challenge to apply this method when little data is available. In this scenario, transfer learning strategies have become a promising alternative to overcome these issues. This work aims to compare the performance of different pre-trained neural networks for feature extraction in image classification tasks. We evaluated 16 different pre-trained models in four datasets, including a dataset of Geological Images that are the focus of this work. Our results demonstrate that for the Geological Images dataset, the best model was CLIP-ViT-B followed by CLIP-ResNet50. Similarly, the best general performance along all four datasets was achieved by CLIP-ViT-B and ViT-H-14, where the CLIP-ResNet50 model had similar performance but with lesser variability. Therefore, our study provides evidence supporting the choice of models for transfer learning in image classification tasks involving the four target datasets.application/pdfengAprendizado de máquinaRedes neuraisImagemImage classificationTransfer learningFeature extractionAn evaluation of pre-trained models for feature extraction in image classificationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001172648.pdf.txt001172648.pdf.txtExtracted Texttext/plain100826http://www.lume.ufrgs.br/bitstream/10183/261764/2/001172648.pdf.txt694835285fc2917548249a271c863db0MD52ORIGINAL001172648.pdfTexto completo (inglês)application/pdf4489020http://www.lume.ufrgs.br/bitstream/10183/261764/1/001172648.pdf3427e79da4d642cd9d33dadcfe0c86e9MD5110183/2617642023-07-19 03:38:19.348345oai:www.lume.ufrgs.br:10183/261764Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-07-19T06:38:19Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv An evaluation of pre-trained models for feature extraction in image classification
title An evaluation of pre-trained models for feature extraction in image classification
spellingShingle An evaluation of pre-trained models for feature extraction in image classification
Puls, Erick da Silva
Aprendizado de máquina
Redes neurais
Imagem
Image classification
Transfer learning
Feature extraction
title_short An evaluation of pre-trained models for feature extraction in image classification
title_full An evaluation of pre-trained models for feature extraction in image classification
title_fullStr An evaluation of pre-trained models for feature extraction in image classification
title_full_unstemmed An evaluation of pre-trained models for feature extraction in image classification
title_sort An evaluation of pre-trained models for feature extraction in image classification
author Puls, Erick da Silva
author_facet Puls, Erick da Silva
author_role author
dc.contributor.author.fl_str_mv Puls, Erick da Silva
dc.contributor.advisor1.fl_str_mv Carbonera, Joel Luis
contributor_str_mv Carbonera, Joel Luis
dc.subject.por.fl_str_mv Aprendizado de máquina
Redes neurais
Imagem
topic Aprendizado de máquina
Redes neurais
Imagem
Image classification
Transfer learning
Feature extraction
dc.subject.eng.fl_str_mv Image classification
Transfer learning
Feature extraction
description Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-07-05T03:46:46Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/261764
dc.identifier.nrb.pt_BR.fl_str_mv 001172648
url http://hdl.handle.net/10183/261764
identifier_str_mv 001172648
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/261764/2/001172648.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/261764/1/001172648.pdf
bitstream.checksum.fl_str_mv 694835285fc2917548249a271c863db0
3427e79da4d642cd9d33dadcfe0c86e9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447344513024000