An evaluation of pre-trained models for feature extraction in image classification
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/261764 |
Resumo: | Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas. |
id |
UFRGS-2_63a314d407282143d6a102d871346e0c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/261764 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Puls, Erick da SilvaCarbonera, Joel Luis2023-07-05T03:46:46Z2023http://hdl.handle.net/10183/261764001172648Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas.In recent years, we have witnessed a considerable increase in performance in image clas sification tasks. This performance improvement is mainly due to the use of deep learning techniques. Generally, deep learning techniques demand a large set of annotated data, making it a challenge to apply this method when little data is available. In this scenario, transfer learning strategies have become a promising alternative to overcome these issues. This work aims to compare the performance of different pre-trained neural networks for feature extraction in image classification tasks. We evaluated 16 different pre-trained models in four datasets, including a dataset of Geological Images that are the focus of this work. Our results demonstrate that for the Geological Images dataset, the best model was CLIP-ViT-B followed by CLIP-ResNet50. Similarly, the best general performance along all four datasets was achieved by CLIP-ViT-B and ViT-H-14, where the CLIP-ResNet50 model had similar performance but with lesser variability. Therefore, our study provides evidence supporting the choice of models for transfer learning in image classification tasks involving the four target datasets.application/pdfengAprendizado de máquinaRedes neuraisImagemImage classificationTransfer learningFeature extractionAn evaluation of pre-trained models for feature extraction in image classificationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2023Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001172648.pdf.txt001172648.pdf.txtExtracted Texttext/plain100826http://www.lume.ufrgs.br/bitstream/10183/261764/2/001172648.pdf.txt694835285fc2917548249a271c863db0MD52ORIGINAL001172648.pdfTexto completo (inglês)application/pdf4489020http://www.lume.ufrgs.br/bitstream/10183/261764/1/001172648.pdf3427e79da4d642cd9d33dadcfe0c86e9MD5110183/2617642023-07-19 03:38:19.348345oai:www.lume.ufrgs.br:10183/261764Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-07-19T06:38:19Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
An evaluation of pre-trained models for feature extraction in image classification |
title |
An evaluation of pre-trained models for feature extraction in image classification |
spellingShingle |
An evaluation of pre-trained models for feature extraction in image classification Puls, Erick da Silva Aprendizado de máquina Redes neurais Imagem Image classification Transfer learning Feature extraction |
title_short |
An evaluation of pre-trained models for feature extraction in image classification |
title_full |
An evaluation of pre-trained models for feature extraction in image classification |
title_fullStr |
An evaluation of pre-trained models for feature extraction in image classification |
title_full_unstemmed |
An evaluation of pre-trained models for feature extraction in image classification |
title_sort |
An evaluation of pre-trained models for feature extraction in image classification |
author |
Puls, Erick da Silva |
author_facet |
Puls, Erick da Silva |
author_role |
author |
dc.contributor.author.fl_str_mv |
Puls, Erick da Silva |
dc.contributor.advisor1.fl_str_mv |
Carbonera, Joel Luis |
contributor_str_mv |
Carbonera, Joel Luis |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Redes neurais Imagem |
topic |
Aprendizado de máquina Redes neurais Imagem Image classification Transfer learning Feature extraction |
dc.subject.eng.fl_str_mv |
Image classification Transfer learning Feature extraction |
description |
Nos últimos anos, temos testemunhado um aumento considerável da performance em tarefas de classificação de imagens. Este aumento de performance se deve principalmente à utilização de técnicas de deep learning. Em geral, a aplicação de deep learning de manda um grande conjunto de dados anotados, o que torna desafiador aplicar tais técnicas em contextos com poucos dados anotados. Neste cenários, estratégias de transfer learn ing vêm se mostrando uma alternativa promissora para superar estes desafios. O objetivo deste trabalho é avaliar a performance de extração de features de diferetes redes neu rais pré-treinadas aplicadas ao problema de classificação de imagens. Nossos resultados demonstraram queue para o dataset de Images Geológicas, o melhor modelo foi o CLIP ViT-B, seguido do CLIP-ResNet50. Semelhante, a melhor performance geral dentre todos os datasets foi alcançada pelos modelos CLIP-ViT-B e ViT-H-14, onde o modelo CLIP ResNet50 obteve perfomance semelhante, porém com variabilidade ainda menor. Sendo assim, nosso trabalho pode fornecer evidências que suportem a escolha de modelos para transfer learning em tarefas de classificação de imagens envolvendo o dataset de Imagens Geológicas. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-07-05T03:46:46Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/261764 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001172648 |
url |
http://hdl.handle.net/10183/261764 |
identifier_str_mv |
001172648 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/261764/2/001172648.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/261764/1/001172648.pdf |
bitstream.checksum.fl_str_mv |
694835285fc2917548249a271c863db0 3427e79da4d642cd9d33dadcfe0c86e9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447344513024000 |