Aprendizado ativo para agrupamento de dados com restrições
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFABC |
Texto Completo: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957 |
Resumo: | Orientador: Prof. Dr. Thiago Ferreira Covões |
id |
UFBC_5b35be35b97258162177ed3b66258948 |
---|---|
oai_identifier_str |
oai:BDTD:121957 |
network_acronym_str |
UFBC |
network_name_str |
Repositório Institucional da UFABC |
repository_id_str |
|
spelling |
Aprendizado ativo para agrupamento de dados com restriçõesAGRUPAMENTO DE DADOS COM RESTRIÇÕESAPRENDIZADO ATIVOAPRENDIZADO SEMISSUPERVISIONADOALGORITMOS EVOLUTIVOSCLASSIFICAÇÃO DE PLÂNCTONCONSTRAINED CLUSTERINGACTIVE LEARNINGSEMI-SUPERVISED LEARNINGEVOLUTIONARY ALGORITHMSPLANKTON CLASSIFICATIONPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCOrientador: Prof. Dr. Thiago Ferreira CovõesCoorientador: Prof. Dr. André Luiz Vizine PereiraDissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, Santo André,, 2019O interesse em aprendizado semissupervisionado tem crescido devido ao alto custo de rotular dados para análise. Paralelamente, o Aprendizado Ativo (AA) visa minimizar o custo da construção de bases de dados rotuladas, buscando identificar quais dados não rotulados são mais relevantes para o aprendizado, considerando os rótulos que já se tem disponíveis. Neste trabalho, é analisada a combinação de AA com aprendizado semissupervisionado, em especial com Agrupamento de Dados com Restrições (ADR). Neste último tipo de aprendizado, ao invés de termos disponíveis rótulos de classe para um conjunto de objetos, somos informados se alguns pares de objetos devem estar no mesmo grupo ou em grupos diferentes. Em algumas aplicações, a identificação desse tipo de restrições envolve um custo reduzido, já que consiste em menos informação do que um rótulo de classe. Este trabalho propõe diferentes estratégias de AA com o aprendizado de Modelos de Mistura de Gaussianas por um Algoritmo Evolutivo de ADR. Foram realizadas avaliações empíricas com 14 bases de dados conhecidas para medir os impactos de cada estratégia, quando comparadas com algoritmos supervisionados e um algoritmo estado-da-arte de AA para ADR. Adicionalmente a essa avaliação, desenvolvemos um estudo de caso relativo ao problema de classificação de plâncton. Apesar do alto custo de rotulação, este problema é abordado em poucos trabalhos no contexto de AA. O objetivo deste estudo de caso é, além de avaliar os métodos desenvolvidos em uma aplicação real, fornecer uma ferramenta que auxilie a classificação de plâncton, minimizando a interação com um especialista.The high cost of labeling data for analysis increased the interest in semi-supervised learning. At the same time, Active Learning (AL) aims to minimize the cost of creating labeled datasets, trying to identify which unlabeled data are more relevant to label during the learning process, considering which labels are already available. This project analyses the combination of AL with semi-supervised learning, especially constrained clustering, which is a type of learning that does not rely on class labels for a group of objects. Instead, there is only information if some pairs of objects must be in the same group or in different groups. In some applications, identifying such constraints involves reduced cost as it is less information than a class label. This work proposes different AL strategies to an evolutionary constrained clustering algorithm based on Gaussian Mixture Models. We conducted an empirical evaluation on 14 well-known datasets to measure the impacts of each strategy, which were compared with supervised algorithms as well as a state-of-the-art AL algorithm for constrained clustering. Additionally, we develop a case study relative to the plankton classification problem. Despite its high labeling cost, this problem has not been much explored in the context of AL. The objective of this case study is to provide a tool that helps plankton classification, minimizing interactions with a specialist, as well as evaluating the developed methods in a real application.Covões, Thiago FerreiraPereira, André Luiz VizineGarcia, Luís Paulo FainaPrati, Ronaldo CristianoFernandes, Matheus Campos2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf118 f. : il.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78866http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78867Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121957porreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2021-10-26T11:05:43Zoai:BDTD:121957Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2021-10-26T11:05:43Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
dc.title.none.fl_str_mv |
Aprendizado ativo para agrupamento de dados com restrições |
title |
Aprendizado ativo para agrupamento de dados com restrições |
spellingShingle |
Aprendizado ativo para agrupamento de dados com restrições Fernandes, Matheus Campos AGRUPAMENTO DE DADOS COM RESTRIÇÕES APRENDIZADO ATIVO APRENDIZADO SEMISSUPERVISIONADO ALGORITMOS EVOLUTIVOS CLASSIFICAÇÃO DE PLÂNCTON CONSTRAINED CLUSTERING ACTIVE LEARNING SEMI-SUPERVISED LEARNING EVOLUTIONARY ALGORITHMS PLANKTON CLASSIFICATION PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
title_short |
Aprendizado ativo para agrupamento de dados com restrições |
title_full |
Aprendizado ativo para agrupamento de dados com restrições |
title_fullStr |
Aprendizado ativo para agrupamento de dados com restrições |
title_full_unstemmed |
Aprendizado ativo para agrupamento de dados com restrições |
title_sort |
Aprendizado ativo para agrupamento de dados com restrições |
author |
Fernandes, Matheus Campos |
author_facet |
Fernandes, Matheus Campos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Covões, Thiago Ferreira Pereira, André Luiz Vizine Garcia, Luís Paulo Faina Prati, Ronaldo Cristiano |
dc.contributor.author.fl_str_mv |
Fernandes, Matheus Campos |
dc.subject.por.fl_str_mv |
AGRUPAMENTO DE DADOS COM RESTRIÇÕES APRENDIZADO ATIVO APRENDIZADO SEMISSUPERVISIONADO ALGORITMOS EVOLUTIVOS CLASSIFICAÇÃO DE PLÂNCTON CONSTRAINED CLUSTERING ACTIVE LEARNING SEMI-SUPERVISED LEARNING EVOLUTIONARY ALGORITHMS PLANKTON CLASSIFICATION PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
topic |
AGRUPAMENTO DE DADOS COM RESTRIÇÕES APRENDIZADO ATIVO APRENDIZADO SEMISSUPERVISIONADO ALGORITMOS EVOLUTIVOS CLASSIFICAÇÃO DE PLÂNCTON CONSTRAINED CLUSTERING ACTIVE LEARNING SEMI-SUPERVISED LEARNING EVOLUTIONARY ALGORITHMS PLANKTON CLASSIFICATION PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABC |
description |
Orientador: Prof. Dr. Thiago Ferreira Covões |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957 |
url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78866 http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=121957&midiaext=78867 Cover: http://biblioteca.ufabc.edu.br/php/capa.php?obra=121957 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 118 f. : il. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
instname_str |
Universidade Federal do ABC (UFABC) |
instacron_str |
UFABC |
institution |
UFABC |
reponame_str |
Repositório Institucional da UFABC |
collection |
Repositório Institucional da UFABC |
repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
repository.mail.fl_str_mv |
|
_version_ |
1813263954245320704 |