Aprendizado em frequência para classificação de imagens

Detalhes bibliográficos
Autor(a) principal: Stuchi, José Augusto, 1984-
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1640152
Resumo: Orientador: Levy Boccato
id UNICAMP-30_82998c32a054983e2c54a32421298939
oai_identifier_str oai::1157826
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Aprendizado em frequência para classificação de imagensFrequency learning for image classificationAprendizado de máquinaAnálise de FourierClassificação de imagemAprendizado profundoEspectro de frequênciaMachine learningFourier analysisImage classificationDeep learningFrequency spectrumOrientador: Levy BoccatoTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: O aprendizado de máquina aplicado à visão computacional e ao processamento de sinais está alcançando resultados comparáveis ao cérebro humano em tarefas específicas devido às grandes melhorias trazidas pelas redes neurais profundas (DNNs, do inglês deep neural networks). Atualmente, a maioria das arquiteturas do estado da arte está relacionada a DNNs, mas apenas algumas exploram o domínio da frequência para extrair informações úteis e melhorar os resultados, como no campo de processamento de imagens. Nesse contexto, este trabalho apresenta uma nova abordagem para explorar a transformada de Fourier das imagens de entrada, a qual é caracterizada pelo emprego de filtros em frequência treináveis que aprendem a extrair os componentes discriminativos do espectro. Além disso, propomos um procedimento de divisão da imagem original em blocos, os quais também são processados por filtros em frequência, de maneira a permitir que a rede identifique atributos globais e locais da imagem a partir das representações no domínio da frequência. O método proposto provou ser competitivo em experimentos de classificação de imagens realizados em bases de dados de texturas (Kylberg) e também em qualidade de imagem de retina (EyeQ), com acurácia muito próxima às redes ConvNets, como MobileNet, Xception, SqueezeNet e ShuffleNet, porém com a vantagem de ser um modelo mais simples e leve. Este trabalho também levanta a discussão sobre como as arquiteturas profundas podem explorar não apenas recursos espaciais, mas também a frequência, a fim de melhorar seu desempenho na solução de problemas do mundo realAbstract: Machine learning applied to computer vision and signal processing is achieving results comparable to the human brain on specific tasks due to the great improvements brought by the deep neural networks (DNNs). The majority of state-of-the-art architectures nowadays is related to DNNs, but only a few explore the frequency domain to extract useful information and improve the results, like in the image processing field. In this context, this thesis presents a new approach for exploring the Fourier transform of the input images, which is characterized by the use of trainable frequency filters that learn to retrieve discriminative components from the spectrum. Additionally, we propose a procedure for splitting the original image into smaller blocks, which are also processed by frequency filters, so that the network can identify both global and local image features from the frequency-domain representations. The proposed method proved to be competitive in image classification experiments carried out in texture (Kylberg) and retinal image quality (EyeQ) datasets, with accuracy very close to ConvNets architectures, like MobileNet, Xception, SqueezeNet and ShuffleNet, but with the advantage of being a simpler and lighter model. This work also raises the discussion on how the state-of-the-art DNNs architectures can exploit not only spatial features, but also the frequency, in order to improve its performance when solving real world problemsDoutoradoEngenharia ElétricaDoutor em Engenharia Elétrica[s.n.]Boccato, Levy, 1986-Von Zuben, Fernando JoséVieira, Marcelo Andrade da CostaScharcasnki, JacobValle, EduardoUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASStuchi, José Augusto, 1984-20202020-10-22T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online ( p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1640152STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1157826Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-01-20T19:52:32Zoai::1157826Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-01-20T19:52:32Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Aprendizado em frequência para classificação de imagens
Frequency learning for image classification
title Aprendizado em frequência para classificação de imagens
spellingShingle Aprendizado em frequência para classificação de imagens
Stuchi, José Augusto, 1984-
Aprendizado de máquina
Análise de Fourier
Classificação de imagem
Aprendizado profundo
Espectro de frequência
Machine learning
Fourier analysis
Image classification
Deep learning
Frequency spectrum
title_short Aprendizado em frequência para classificação de imagens
title_full Aprendizado em frequência para classificação de imagens
title_fullStr Aprendizado em frequência para classificação de imagens
title_full_unstemmed Aprendizado em frequência para classificação de imagens
title_sort Aprendizado em frequência para classificação de imagens
author Stuchi, José Augusto, 1984-
author_facet Stuchi, José Augusto, 1984-
author_role author
dc.contributor.none.fl_str_mv Boccato, Levy, 1986-
Von Zuben, Fernando José
Vieira, Marcelo Andrade da Costa
Scharcasnki, Jacob
Valle, Eduardo
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Stuchi, José Augusto, 1984-
dc.subject.por.fl_str_mv Aprendizado de máquina
Análise de Fourier
Classificação de imagem
Aprendizado profundo
Espectro de frequência
Machine learning
Fourier analysis
Image classification
Deep learning
Frequency spectrum
topic Aprendizado de máquina
Análise de Fourier
Classificação de imagem
Aprendizado profundo
Espectro de frequência
Machine learning
Fourier analysis
Image classification
Deep learning
Frequency spectrum
description Orientador: Levy Boccato
publishDate 2020
dc.date.none.fl_str_mv 2020
2020-10-22T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1640152
STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1640152
identifier_str_mv STUCHI, José Augusto. Aprendizado em frequência para classificação de imagens. 2020. 1 recurso online ( p.) Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1640152. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1157826
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online ( p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189167894102016