Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento

Detalhes bibliográficos
Autor(a) principal: Presotto, João Gabriel Camacho
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/214841
Resumo: Apesar dos impressionantes avanços recentes nas técnicas de aprendizado de máquina, principalmente na compreensão de dados multimídia, desafios significativos ainda persistem. Um dos principais desafios em cenários reais apresenta-se na escassa disponibilidade de dados rotulados. Nesse contexto, desenvolver métodos capazes de explorar as informações presentes em dados não rotulados de modo a mitigar os problemas associados à insuficiência de dados rotulados é um desafio de suma importância. Métodos de aprendizado fracamente supervisionado conseguem lidar com tais restrições ao trabalhar com rótulos estimados ou aproximados como maneira de potencializar informações úteis de treinamento. Nessa linha de pesquisa, apresentaremos dois métodos de aprendizado fracamente supervisionado capazes de analisar as relações entre os dados rotulados e não rotulados, de modo a expandir pequenos conjuntos de treinamento rotulados. Ambos recorrem a um modelo de ranqueamento e utilizam diferentes estratégias para analisar as informações de similaridade codificadas nos dados não rotulados e identificar fortes relações de similaridade com os dados rotulados. Tais relações são consideradas durante a etapa de expansão do conjunto de treinamento. Os métodos foram avaliados em conjunto com diferentes classificadores supervisionados e semi-supervisionados, incluindo uma recente rede convolucional baseada em grafos. Foram considerados cinco diferentes coleções de imagens públicas e os vetores de características de cada imagem foram obtidos através de diferentes descritores visuais. Ganhos positivos de acurácia foram obtidos por ambos os métodos nos mais diferentes cenários quando comparados aos classificadores treinados sem o auxílio de nossos métodos e a técnicas de expansão similares, evidenciando a robustez das abordagens propostas.
id UNSP_439201dc14736b01449cf10635c8f2e5
oai_identifier_str oai:repositorio.unesp.br:11449/214841
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamentoRank-based weakly supervised machine learning methodsAprendizado fracamente supervisionadoAprendizado de máquinaAprendizado semi-supervisionadoModelo de ranqueamentoMétricas de correlação de listas ranqueadasRecuperação de imagens baseada em conteúdoWeakly supervised learningRank correlation measuresContent-based image retrievalMachine learningSemi-supervised learningRankingApesar dos impressionantes avanços recentes nas técnicas de aprendizado de máquina, principalmente na compreensão de dados multimídia, desafios significativos ainda persistem. Um dos principais desafios em cenários reais apresenta-se na escassa disponibilidade de dados rotulados. Nesse contexto, desenvolver métodos capazes de explorar as informações presentes em dados não rotulados de modo a mitigar os problemas associados à insuficiência de dados rotulados é um desafio de suma importância. Métodos de aprendizado fracamente supervisionado conseguem lidar com tais restrições ao trabalhar com rótulos estimados ou aproximados como maneira de potencializar informações úteis de treinamento. Nessa linha de pesquisa, apresentaremos dois métodos de aprendizado fracamente supervisionado capazes de analisar as relações entre os dados rotulados e não rotulados, de modo a expandir pequenos conjuntos de treinamento rotulados. Ambos recorrem a um modelo de ranqueamento e utilizam diferentes estratégias para analisar as informações de similaridade codificadas nos dados não rotulados e identificar fortes relações de similaridade com os dados rotulados. Tais relações são consideradas durante a etapa de expansão do conjunto de treinamento. Os métodos foram avaliados em conjunto com diferentes classificadores supervisionados e semi-supervisionados, incluindo uma recente rede convolucional baseada em grafos. Foram considerados cinco diferentes coleções de imagens públicas e os vetores de características de cada imagem foram obtidos através de diferentes descritores visuais. Ganhos positivos de acurácia foram obtidos por ambos os métodos nos mais diferentes cenários quando comparados aos classificadores treinados sem o auxílio de nossos métodos e a técnicas de expansão similares, evidenciando a robustez das abordagens propostas.Despite the impressive recent advances in machine learning techniques, especially in multimedia data understanding, significant challenges remain. One of the main challenges in real-world scenarios is the limited availability of labeled data. In this context, developing methods capable of exploiting the information encoded in the unlabeled data to mitigate the problems associated with insufficient labeled data, and to overcome this issue is something of paramount importance. Weakly supervised learning methods are capable to handle such restrictions by working with estimated or approximate labels as a way to maximize useful training information. In this line of research, we will present two weakly supervised methods that can analyze the relationships between labeled and unlabeled data to expand small labeled training sets. Both use a ranking model and different strategies to examine similarity information encoded in the unlabeled data to identify strong similarity relationships with the labeled data. Such relations will be considered during the training set expansion step. The methods were evaluated in conjunction with different supervised and semi-supervised classifiers, including a recent graph convolutional network. Five different public image datasets were considered with different visual descriptors. Positive accuracy gains were achieved by both methods in the different scenarios when compared to classifiers trained without the aid of our methods and compared to similar expansion techniques, evidencing the strength of both.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)FAPESP: 19/04754-6.Universidade Estadual Paulista (Unesp)Pedronette, Daniel Carlos Guimarães [UNESP]Universidade Estadual Paulista (Unesp)Presotto, João Gabriel Camacho2021-10-22T12:34:29Z2021-10-22T12:34:29Z2021-08-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/21484133004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-10-08T06:07:40Zoai:repositorio.unesp.br:11449/214841Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T14:21:20.426251Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
Rank-based weakly supervised machine learning methods
title Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
spellingShingle Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
Presotto, João Gabriel Camacho
Aprendizado fracamente supervisionado
Aprendizado de máquina
Aprendizado semi-supervisionado
Modelo de ranqueamento
Métricas de correlação de listas ranqueadas
Recuperação de imagens baseada em conteúdo
Weakly supervised learning
Rank correlation measures
Content-based image retrieval
Machine learning
Semi-supervised learning
Ranking
title_short Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
title_full Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
title_fullStr Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
title_full_unstemmed Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
title_sort Métodos de aprendizado de máquina fracamente supervisionados baseados em ranqueamento
author Presotto, João Gabriel Camacho
author_facet Presotto, João Gabriel Camacho
author_role author
dc.contributor.none.fl_str_mv Pedronette, Daniel Carlos Guimarães [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Presotto, João Gabriel Camacho
dc.subject.por.fl_str_mv Aprendizado fracamente supervisionado
Aprendizado de máquina
Aprendizado semi-supervisionado
Modelo de ranqueamento
Métricas de correlação de listas ranqueadas
Recuperação de imagens baseada em conteúdo
Weakly supervised learning
Rank correlation measures
Content-based image retrieval
Machine learning
Semi-supervised learning
Ranking
topic Aprendizado fracamente supervisionado
Aprendizado de máquina
Aprendizado semi-supervisionado
Modelo de ranqueamento
Métricas de correlação de listas ranqueadas
Recuperação de imagens baseada em conteúdo
Weakly supervised learning
Rank correlation measures
Content-based image retrieval
Machine learning
Semi-supervised learning
Ranking
description Apesar dos impressionantes avanços recentes nas técnicas de aprendizado de máquina, principalmente na compreensão de dados multimídia, desafios significativos ainda persistem. Um dos principais desafios em cenários reais apresenta-se na escassa disponibilidade de dados rotulados. Nesse contexto, desenvolver métodos capazes de explorar as informações presentes em dados não rotulados de modo a mitigar os problemas associados à insuficiência de dados rotulados é um desafio de suma importância. Métodos de aprendizado fracamente supervisionado conseguem lidar com tais restrições ao trabalhar com rótulos estimados ou aproximados como maneira de potencializar informações úteis de treinamento. Nessa linha de pesquisa, apresentaremos dois métodos de aprendizado fracamente supervisionado capazes de analisar as relações entre os dados rotulados e não rotulados, de modo a expandir pequenos conjuntos de treinamento rotulados. Ambos recorrem a um modelo de ranqueamento e utilizam diferentes estratégias para analisar as informações de similaridade codificadas nos dados não rotulados e identificar fortes relações de similaridade com os dados rotulados. Tais relações são consideradas durante a etapa de expansão do conjunto de treinamento. Os métodos foram avaliados em conjunto com diferentes classificadores supervisionados e semi-supervisionados, incluindo uma recente rede convolucional baseada em grafos. Foram considerados cinco diferentes coleções de imagens públicas e os vetores de características de cada imagem foram obtidos através de diferentes descritores visuais. Ganhos positivos de acurácia foram obtidos por ambos os métodos nos mais diferentes cenários quando comparados aos classificadores treinados sem o auxílio de nossos métodos e a técnicas de expansão similares, evidenciando a robustez das abordagens propostas.
publishDate 2021
dc.date.none.fl_str_mv 2021-10-22T12:34:29Z
2021-10-22T12:34:29Z
2021-08-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/214841
33004153073P2
url http://hdl.handle.net/11449/214841
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128350955241472