Aprendizado em frequência para classificação de imagens
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1640152 |
Resumo: | Orientador: Levy Boccato |
id |
UNICAMP-30_82998c32a054983e2c54a32421298939 |
---|---|
oai_identifier_str |
oai::1157826 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Aprendizado em frequência para classificação de imagensFrequency learning for image classificationAprendizado de máquinaAnálise de FourierClassificação de imagemAprendizado profundoEspectro de frequênciaMachine learningFourier analysisImage classificationDeep learningFrequency spectrumOrientador: Levy BoccatoTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: O aprendizado de máquina aplicado à visão computacional e ao processamento de sinais está alcançando resultados comparáveis ao cérebro humano em tarefas específicas devido às grandes melhorias trazidas pelas redes neurais profundas (DNNs, do inglês deep neural networks). Atualmente, a maioria das arquiteturas do estado da arte está relacionada a DNNs, mas apenas algumas exploram o domínio da frequência para extrair informações úteis e melhorar os resultados, como no campo de processamento de imagens. Nesse contexto, este trabalho apresenta uma nova abordagem para explorar a transformada de Fourier das imagens de entrada, a qual é caracterizada pelo emprego de filtros em frequência treináveis que aprendem a extrair os componentes discriminativos do espectro. Além disso, propomos um procedimento de divisão da imagem original em blocos, os quais também são processados por filtros em frequência, de maneira a permitir que a rede identifique atributos globais e locais da imagem a partir das representações no domínio da frequência. O método proposto provou ser competitivo em experimentos de classificação de imagens realizados em bases de dados de texturas (Kylberg) e também em qualidade de imagem de retina (EyeQ), com acurácia muito próxima às redes ConvNets, como MobileNet, Xception, SqueezeNet e ShuffleNet, porém com a vantagem de ser um modelo mais simples e leve. Este trabalho também levanta a discussão sobre como as arquiteturas profundas podem explorar não apenas recursos espaciais, mas também a frequência, a fim de melhorar seu desempenho na solução de problemas do mundo realAbstract: Machine learning applied to computer vision and signal processing is achieving results comparable to the human brain on specific tasks due to the great improvements brought by the deep neural networks (DNNs). The majority of state-of-the-art architectures nowadays is related to DNNs, but only a few explore the frequency domain to extract useful information and improve the results, like in the image processing field. In this context, this thesis presents a new approach for exploring the Fourier transform of the input images, which is characterized by the use of trainable frequency filters that learn to retrieve discriminative components from the spectrum. Additionally, we propose a procedure for splitting the original image into smaller blocks, which are also processed by frequency filters, so that the network can identify both global and local image features from the frequency-domain representations. The proposed method proved to be competitive in image classification experiments carried out in texture (Kylberg) and retinal image quality (EyeQ) datasets, with accuracy very close to ConvNets architectures, like MobileNet, Xception, SqueezeNet and ShuffleNet, but with the advantage of being a simpler and lighter model. This work also raises the discussion on how the state-of-the-art DNNs architectures can exploit not only spatial features, but also the frequency, in order to improve its performance when solving real world problemsDoutoradoEngenharia ElétricaDoutor em Engenharia Elétrica[s.n.]Boccato, Levy, 1986-Von Zuben, Fernando JoséVieira, Marcelo Andrade da CostaScharcasnki, JacobValle, EduardoUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASStuchi, José Augusto, 1984-20202020-10-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online ( p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1640152STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1157826Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-01-20T19:52:32Zoai::1157826Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-01-20T19:52:32Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Aprendizado em frequência para classificação de imagens Frequency learning for image classification |
title |
Aprendizado em frequência para classificação de imagens |
spellingShingle |
Aprendizado em frequência para classificação de imagens Stuchi, José Augusto, 1984- Aprendizado de máquina Análise de Fourier Classificação de imagem Aprendizado profundo Espectro de frequência Machine learning Fourier analysis Image classification Deep learning Frequency spectrum |
title_short |
Aprendizado em frequência para classificação de imagens |
title_full |
Aprendizado em frequência para classificação de imagens |
title_fullStr |
Aprendizado em frequência para classificação de imagens |
title_full_unstemmed |
Aprendizado em frequência para classificação de imagens |
title_sort |
Aprendizado em frequência para classificação de imagens |
author |
Stuchi, José Augusto, 1984- |
author_facet |
Stuchi, José Augusto, 1984- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Boccato, Levy, 1986- Von Zuben, Fernando José Vieira, Marcelo Andrade da Costa Scharcasnki, Jacob Valle, Eduardo Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Stuchi, José Augusto, 1984- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Análise de Fourier Classificação de imagem Aprendizado profundo Espectro de frequência Machine learning Fourier analysis Image classification Deep learning Frequency spectrum |
topic |
Aprendizado de máquina Análise de Fourier Classificação de imagem Aprendizado profundo Espectro de frequência Machine learning Fourier analysis Image classification Deep learning Frequency spectrum |
description |
Orientador: Levy Boccato |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2020-10-22T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1640152 STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1640152 |
identifier_str_mv |
STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1157826 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online ( p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189167894102016 |