Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado

Gabriel Biscaro Cavallari

Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado

Detalhes bibliográficos
Autor(a) principal:	Gabriel Biscaro Cavallari
Data de Publicação:	2022
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://doi.org/10.11606/D.55.2022.tde-08082022-084706
Resumo:	Sistemas atuais de visão computacional demonstram excelente desempenho em uma variedade de benchmarks, como detecção de objetos, reconhecimento e segmentação semântica de imagens. O treinamento dessas redes segue principalmente o paradigma de aprendizado supervisionado, em que são necessários muitos pares de entrada-saída para o treinamento. No entanto, grandes quantidades de dados rotulados manualmente são custosos e complexos de obter. Portanto, o aprendizado sem a necessidade de dados anotados é de grande importância para aproveitar a grande quantidade de dados visuais não rotulados geralmente disponíveis. Para enfrentar esse desafio, métodos de aprendizado não supervisionado e semi-supervisionado podem auxiliar na utilização de dados não rotulados para reduzir a dependência de grandes conjuntos de dados rotulados. Esta pesquisa tem como objetivo investigar diferentes arquiteturas e estratégias de treinamento que consideram uma situação em que se tem apenas dados não rotulados e dados rotulados limitados. Nossa hipótese é que essa estratégia melhora a generalização e a discriminação do espaço de características aprendido. Por meio de tarefas auxiliares, diferentes bases de dados e experimentos extensivos, concluímos que tanto o aprendizado semi-supervisionado quanto o auto-supervisionado seguido de ajuste fino geram representações discriminativas. Ainda, que essas representações tendem a ser mais robustas à ataques quando comparadas àquelas aprendidas em contextos puramente supervisionados.

Metadados do item

id	USP_97815537b64ff649f074da23a56bd81c
oai_identifier_str	oai:teses.usp.br:tde-08082022-084706
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado A study of image representations from multiple domains using unsupervised and semi-supervised deep learning 2022-05-24Moacir Antonelli PontiZhao LiangAnderson de Rezende RochaEduardo Alves do Valle JuniorGabriel Biscaro CavallariUniversidade de São PauloCiências da Computação e Matemática ComputacionalUSPBR Aprendizado de características Aprendizado não supervisionado Aprendizado profundo Aprendizado semisupervisionado Auto-supervisão Deep learning Feature learning Self-supervision Semi-supervised learning Unsupervised learning Sistemas atuais de visão computacional demonstram excelente desempenho em uma variedade de benchmarks, como detecção de objetos, reconhecimento e segmentação semântica de imagens. O treinamento dessas redes segue principalmente o paradigma de aprendizado supervisionado, em que são necessários muitos pares de entrada-saída para o treinamento. No entanto, grandes quantidades de dados rotulados manualmente são custosos e complexos de obter. Portanto, o aprendizado sem a necessidade de dados anotados é de grande importância para aproveitar a grande quantidade de dados visuais não rotulados geralmente disponíveis. Para enfrentar esse desafio, métodos de aprendizado não supervisionado e semi-supervisionado podem auxiliar na utilização de dados não rotulados para reduzir a dependência de grandes conjuntos de dados rotulados. Esta pesquisa tem como objetivo investigar diferentes arquiteturas e estratégias de treinamento que consideram uma situação em que se tem apenas dados não rotulados e dados rotulados limitados. Nossa hipótese é que essa estratégia melhora a generalização e a discriminação do espaço de características aprendido. Por meio de tarefas auxiliares, diferentes bases de dados e experimentos extensivos, concluímos que tanto o aprendizado semi-supervisionado quanto o auto-supervisionado seguido de ajuste fino geram representações discriminativas. Ainda, que essas representações tendem a ser mais robustas à ataques quando comparadas àquelas aprendidas em contextos puramente supervisionados. Modern computer vision systems demonstrate outstanding performance on a variety of challenging benchmarks, such as object detection, image recognition and semantic image segmentation. Training of such networks follows mostly the supervised learning paradigm, where sufficiently many input-output pairs are required for training. However, massive amounts of manually labeled data is both expensive and impractical to scale. Therefore, learning without requiring manual annotation effort is of crucial importance in order to successfully take advantage of the vast amount of unlabeled visual data that is available today. To address this challenge, unsupervised and semi-supervised learning methods could be a powerful paradigm for leveraging unlabeled data to mitigate the reliance on large labeled datasets. This research aims to investigate different architectures and training strategies that considers both unlabeled and limited labeled data. Our hypothesis is that this strategy improves the generalization and discrimination of the learned feature space. Through auxiliary tasks, different datasets and extensive experiments, we concluded that both semi-supervised and self-supervised learning followed by fine-tuning generate discriminative representations. Furthermore, these representations tend to be more robust to attacks when compared to those learned in purely supervised context https://doi.org/10.11606/D.55.2022.tde-08082022-084706info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T18:28:39Zoai:teses.usp.br:tde-08082022-084706Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212023-12-22T12:20:34.043871Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
dc.title.alternative.en.fl_str_mv	A study of image representations from multiple domains using unsupervised and semi-supervised deep learning
title	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
spellingShingle	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado Gabriel Biscaro Cavallari
title_short	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
title_full	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
title_fullStr	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
title_full_unstemmed	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
title_sort	Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado
author	Gabriel Biscaro Cavallari
author_facet	Gabriel Biscaro Cavallari
author_role	author
dc.contributor.advisor1.fl_str_mv	Moacir Antonelli Ponti
dc.contributor.referee1.fl_str_mv	Zhao Liang
dc.contributor.referee2.fl_str_mv	Anderson de Rezende Rocha
dc.contributor.referee3.fl_str_mv	Eduardo Alves do Valle Junior
dc.contributor.author.fl_str_mv	Gabriel Biscaro Cavallari
contributor_str_mv	Moacir Antonelli Ponti Zhao Liang Anderson de Rezende Rocha Eduardo Alves do Valle Junior
description	Sistemas atuais de visão computacional demonstram excelente desempenho em uma variedade de benchmarks, como detecção de objetos, reconhecimento e segmentação semântica de imagens. O treinamento dessas redes segue principalmente o paradigma de aprendizado supervisionado, em que são necessários muitos pares de entrada-saída para o treinamento. No entanto, grandes quantidades de dados rotulados manualmente são custosos e complexos de obter. Portanto, o aprendizado sem a necessidade de dados anotados é de grande importância para aproveitar a grande quantidade de dados visuais não rotulados geralmente disponíveis. Para enfrentar esse desafio, métodos de aprendizado não supervisionado e semi-supervisionado podem auxiliar na utilização de dados não rotulados para reduzir a dependência de grandes conjuntos de dados rotulados. Esta pesquisa tem como objetivo investigar diferentes arquiteturas e estratégias de treinamento que consideram uma situação em que se tem apenas dados não rotulados e dados rotulados limitados. Nossa hipótese é que essa estratégia melhora a generalização e a discriminação do espaço de características aprendido. Por meio de tarefas auxiliares, diferentes bases de dados e experimentos extensivos, concluímos que tanto o aprendizado semi-supervisionado quanto o auto-supervisionado seguido de ajuste fino geram representações discriminativas. Ainda, que essas representações tendem a ser mais robustas à ataques quando comparadas àquelas aprendidas em contextos puramente supervisionados.
publishDate	2022
dc.date.issued.fl_str_mv	2022-05-24
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://doi.org/10.11606/D.55.2022.tde-08082022-084706
url	https://doi.org/10.11606/D.55.2022.tde-08082022-084706
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade de São Paulo
dc.publisher.program.fl_str_mv	Ciências da Computação e Matemática Computacional
dc.publisher.initials.fl_str_mv	USP
dc.publisher.country.fl_str_mv	BR
publisher.none.fl_str_mv	Universidade de São Paulo
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1794502574151303168

Estudo de representações de imagens de múltiplos domínios a partir de aprendizado profundo não supervisionado e semi-supervisionado

Registros relacionados