Aprendizado ativo para agrupamento de dados com restrições

Detalhes bibliográficos
Autor(a) principal: Fernandes, Matheus Campos
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFABC
Texto Completo: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957
Resumo: Orientador: Prof. Dr. Thiago Ferreira Covões
id UFBC_5b35be35b97258162177ed3b66258948
oai_identifier_str oai:BDTD:121957
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling Aprendizado ativo para agrupamento de dados com restriçõesAGRUPAMENTO DE DADOS COM RESTRIÇÕESAPRENDIZADO ATIVOAPRENDIZADO SEMISSUPERVISIONADOALGORITMOS EVOLUTIVOSCLASSIFICAÇÃO DE PLÂNCTONCONSTRAINED CLUSTERINGACTIVE LEARNINGSEMI-SUPERVISED LEARNINGEVOLUTIONARY ALGORITHMSPLANKTON CLASSIFICATIONPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientador: Prof. Dr. Thiago Ferreira CovõesCoorientador: Prof. Dr. André Luiz Vizine PereiraDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André,, 2019O interesse em aprendizado semissupervisionado tem crescido devido ao alto custo de rotular dados para análise. Paralelamente, o Aprendizado Ativo (AA) visa minimizar o custo da construção de bases de dados rotuladas, buscando identificar quais dados não rotulados são mais relevantes para o aprendizado, considerando os rótulos que já se tem disponíveis. Neste trabalho, é analisada a combinação de AA com aprendizado semissupervisionado, em especial com Agrupamento de Dados com Restrições (ADR). Neste último tipo de aprendizado, ao invés de termos disponíveis rótulos de classe para um conjunto de objetos, somos informados se alguns pares de objetos devem estar no mesmo grupo ou em grupos diferentes. Em algumas aplicações, a identificação desse tipo de restrições envolve um custo reduzido, já que consiste em menos informação do que um rótulo de classe. Este trabalho propõe diferentes estratégias de AA com o aprendizado de Modelos de Mistura de Gaussianas por um Algoritmo Evolutivo de ADR. Foram realizadas avaliações empíricas com 14 bases de dados conhecidas para medir os impactos de cada estratégia, quando comparadas com algoritmos supervisionados e um algoritmo estado-da-arte de AA para ADR. Adicionalmente a essa avaliação, desenvolvemos um estudo de caso relativo ao problema de classificação de plâncton. Apesar do alto custo de rotulação, este problema é abordado em poucos trabalhos no contexto de AA. O objetivo deste estudo de caso é, além de avaliar os métodos desenvolvidos em uma aplicação real, fornecer uma ferramenta que auxilie a classificação de plâncton, minimizando a interação com um especialista.The high cost of labeling data for analysis increased the interest in semi-supervised learning. At the same time, Active Learning (AL) aims to minimize the cost of creating labeled datasets, trying to identify which unlabeled data are more relevant to label during the learning process, considering which labels are already available. This project analyses the combination of AL with semi-supervised learning, especially constrained clustering, which is a type of learning that does not rely on class labels for a group of objects. Instead, there is only information if some pairs of objects must be in the same group or in different groups. In some applications, identifying such constraints involves reduced cost as it is less information than a class label. This work proposes different AL strategies to an evolutionary constrained clustering algorithm based on Gaussian Mixture Models. We conducted an empirical evaluation on 14 well-known datasets to measure the impacts of each strategy, which were compared with supervised algorithms as well as a state-of-the-art AL algorithm for constrained clustering. Additionally, we develop a case study relative to the plankton classification problem. Despite its high labeling cost, this problem has not been much explored in the context of AL. The objective of this case study is to provide a tool that helps plankton classification, minimizing interactions with a specialist, as well as evaluating the developed methods in a real application.Covões, Thiago FerreiraPereira, André Luiz VizineGarcia, Luís Paulo FainaPrati, Ronaldo CristianoFernandes, Matheus Campos2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf118 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78866http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78867Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121957porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2021-10-26T11:05:43Zoai:BDTD:121957Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2021-10-26T11:05:43Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.none.fl_str_mv Aprendizado ativo para agrupamento de dados com restrições
title Aprendizado ativo para agrupamento de dados com restrições
spellingShingle Aprendizado ativo para agrupamento de dados com restrições
Fernandes, Matheus Campos
AGRUPAMENTO DE DADOS COM RESTRIÇÕES
APRENDIZADO ATIVO
APRENDIZADO SEMISSUPERVISIONADO
ALGORITMOS EVOLUTIVOS
CLASSIFICAÇÃO DE PLÂNCTON
CONSTRAINED CLUSTERING
ACTIVE LEARNING
SEMI-SUPERVISED LEARNING
EVOLUTIONARY ALGORITHMS
PLANKTON CLASSIFICATION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
title_short Aprendizado ativo para agrupamento de dados com restrições
title_full Aprendizado ativo para agrupamento de dados com restrições
title_fullStr Aprendizado ativo para agrupamento de dados com restrições
title_full_unstemmed Aprendizado ativo para agrupamento de dados com restrições
title_sort Aprendizado ativo para agrupamento de dados com restrições
author Fernandes, Matheus Campos
author_facet Fernandes, Matheus Campos
author_role author
dc.contributor.none.fl_str_mv Covões, Thiago Ferreira
Pereira, André Luiz Vizine
Garcia, Luís Paulo Faina
Prati, Ronaldo Cristiano
dc.contributor.author.fl_str_mv Fernandes, Matheus Campos
dc.subject.por.fl_str_mv AGRUPAMENTO DE DADOS COM RESTRIÇÕES
APRENDIZADO ATIVO
APRENDIZADO SEMISSUPERVISIONADO
ALGORITMOS EVOLUTIVOS
CLASSIFICAÇÃO DE PLÂNCTON
CONSTRAINED CLUSTERING
ACTIVE LEARNING
SEMI-SUPERVISED LEARNING
EVOLUTIONARY ALGORITHMS
PLANKTON CLASSIFICATION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
topic AGRUPAMENTO DE DADOS COM RESTRIÇÕES
APRENDIZADO ATIVO
APRENDIZADO SEMISSUPERVISIONADO
ALGORITMOS EVOLUTIVOS
CLASSIFICAÇÃO DE PLÂNCTON
CONSTRAINED CLUSTERING
ACTIVE LEARNING
SEMI-SUPERVISED LEARNING
EVOLUTIONARY ALGORITHMS
PLANKTON CLASSIFICATION
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC
description Orientador: Prof. Dr. Thiago Ferreira Covões
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78866
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78867
Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121957
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
118 f. : il.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1813263954245320704