An investigation of neural architecture search in the context of deep multi-task learning.

Detalhes bibliográficos
Autor(a) principal: GADELHA, Guilherme Monteiro.
Data de Publicação: 2024
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFCG
Texto Completo: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36528
Resumo: O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.
id UFCG_af03cae39c87935a3728d0e50ebff974
oai_identifier_str oai:localhost:riufcg/36528
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str 4851
spelling An investigation of neural architecture search in the context of deep multi-task learning.Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda.Neural architecture searchMulti-task learningImage classificationPesquisa de arquitetura neuralAprendizagem multitarefaClassificação de imagensCiência da Computação.O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.Multi-task learning (MTL) is a design paradigm for neural networks that aims to improve generalization while solving multiple tasks simultaneously in a single network. MTL has been successful in various fields such as Natural Language Processing, Speech Recognition, Computer Vision, and Drug Discovery. Neural Architecture Search (NAS) is a subfield of Deep Learning that proposes methods to automatically design neural networks by searching and arranging layers and blocks to maximize an objective function. Currently, there are few methods in the literature that explore the use of NAS to build MTL networks. In this context, this work investigates a sequence of comparative experiments between multi-task networks, single-task networks, and networks created with a neural architecture search strategy. These experiments aim to understand better the differences between these paradigms of neural network design and compare the results achieved by each. We investigated neural network architectures for different use cases, such as the ICAO-FVC dataset, MNIST, FASHION-MNIST, Celeb-A, and CIFAR-10 datasets. Additionally, we experimented with a well-established dataset of NAS to benchmark new proposed methods in the field. Our experiments have revealed that the NAS technique, developed through Reinforcement Learning, is capable of discovering optimal architectures in a shorter time than the current state-of-theart technique based on Regularized Evolution. Furthermore, this technique has demonstrated competitive results across various datasets of multi-task learning, in terms of accuracy and equal error rate. While it may not be the top performer in the case of ICAO-FVC, it still delivers a competitive outcome and holds the potential to uncover even better architectures than the best handcrafted one.CNPqUniversidade Federal de Campina GrandeBrasilCentro de Engenharia Elétrica e Informática - CEEIPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGGOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271BATISTA, Leonardo Vidal.BATISTA, L. V.http://lattes.cnpq.br/1047122596139990ARAÚJO , Tiago Maritan Ugulino de.PAIVA , Anselmo Cardoso de.MARINHO , Leandro Balby.PEREIRA , Eanes Torres.GADELHA, Guilherme Monteiro.2024-01-292024-07-08T19:42:38Z2024-07-082024-07-08T19:42:38Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36528GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCG2024-07-08T21:12:08Zoai:localhost:riufcg/36528Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512024-07-08T21:12:08Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.none.fl_str_mv An investigation of neural architecture search in the context of deep multi-task learning.
Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda.
title An investigation of neural architecture search in the context of deep multi-task learning.
spellingShingle An investigation of neural architecture search in the context of deep multi-task learning.
GADELHA, Guilherme Monteiro.
Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
Ciência da Computação.
title_short An investigation of neural architecture search in the context of deep multi-task learning.
title_full An investigation of neural architecture search in the context of deep multi-task learning.
title_fullStr An investigation of neural architecture search in the context of deep multi-task learning.
title_full_unstemmed An investigation of neural architecture search in the context of deep multi-task learning.
title_sort An investigation of neural architecture search in the context of deep multi-task learning.
author GADELHA, Guilherme Monteiro.
author_facet GADELHA, Guilherme Monteiro.
author_role author
dc.contributor.none.fl_str_mv GOMES, Herman Martins.
GOMES, H. M.
http://lattes.cnpq.br/4223020694433271
BATISTA, Leonardo Vidal.
BATISTA, L. V.
http://lattes.cnpq.br/1047122596139990
ARAÚJO , Tiago Maritan Ugulino de.
PAIVA , Anselmo Cardoso de.
MARINHO , Leandro Balby.
PEREIRA , Eanes Torres.
dc.contributor.author.fl_str_mv GADELHA, Guilherme Monteiro.
dc.subject.por.fl_str_mv Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
Ciência da Computação.
topic Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
Ciência da Computação.
description O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.
publishDate 2024
dc.date.none.fl_str_mv 2024-01-29
2024-07-08T19:42:38Z
2024-07-08
2024-07-08T19:42:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36528
GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36528
identifier_str_mv GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1809744628005470208