Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado

Detalhes bibliográficos
Autor(a) principal: Vale, Karliane Medeiros Ovidio
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/jspui/handle/123456789/28464
Resumo: O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos.
id UFRN_fa9dcccdc2b230ce5bc70c82e1b35980
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/28464
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Vale, Karliane Medeiros OvidioSantos, Araken de MedeirosAraújo, Daniel Sabino Amorim deNascimento, Diego Silveira CostaGorgônio, Flavius da Luz eAbreu, Marjory Cristiany da CostaCanuto, Anne Magaly de Paula2020-02-11T16:39:59Z2020-02-11T16:39:59Z2019-11-22VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.https://repositorio.ufrn.br/jspui/handle/123456789/28464O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos.Semi-supervised learning is a kind of machine learning that integrates supervised and unsupervised learning mechanisms. In this type of learning, most of training set labels are unknown, while there is a small part of data that has known labels. The semi-supervised learning is attractive because of its potential to use labeled and unlabeled data to perform better than supervised learning. This paper consists of a study in the field of semisupervised learning and implements changes on the self-training and co-training semisupervised learning algorithms. In the literature, it is common to develop researches that change the structure of such algorithms, however, none of them proposes automating the labeling process of unlabeled instances, which is the main purpose of this work. In order to achieve this goal, three methods are proposed: FlexCon-G, FlexCon e FlexCon-C. The main difference among these methods is how tje confidence rate is calculated and the strategy used to choose a label in each iteration, among them ensembles. In order to evaluate the proposed methods’ performance, we have carried out an empirical analysis, in which the performances of these methods have been evaluated on 30 datasets with diversified characteristics. The obtained results indicate that the three proposed methods perform better than original self-training and co-training methods in most cases.CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOInteligência artificialAprendizado de máquinaAprendizado SemissupervisionadoSelf-trainingCo-trainingUma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionadoA proposal for automating the instance labeling process in semi-supervised learning algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTPropostaautomatizacaoprocesso_Vale_2019.pdf.txtPropostaautomatizacaoprocesso_Vale_2019.pdf.txtExtracted texttext/plain256292https://repositorio.ufrn.br/bitstream/123456789/28464/2/Propostaautomatizacaoprocesso_Vale_2019.pdf.txtd7331f0888eeae7e377d5fb201e0c461MD52THUMBNAILPropostaautomatizacaoprocesso_Vale_2019.pdf.jpgPropostaautomatizacaoprocesso_Vale_2019.pdf.jpgGenerated Thumbnailimage/jpeg1264https://repositorio.ufrn.br/bitstream/123456789/28464/3/Propostaautomatizacaoprocesso_Vale_2019.pdf.jpgeb0c3707c75e2aa5df5c418a7f204a11MD53ORIGINALPropostaautomatizacaoprocesso_Vale_2019.pdfapplication/pdf1962883https://repositorio.ufrn.br/bitstream/123456789/28464/1/Propostaautomatizacaoprocesso_Vale_2019.pdf8dae722c2469f9366804448060965c5aMD51123456789/284642020-02-16 04:54:54.622oai:https://repositorio.ufrn.br:123456789/28464Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2020-02-16T07:54:54Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
dc.title.alternative.pt_BR.fl_str_mv A proposal for automating the instance labeling process in semi-supervised learning algorithms
title Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
spellingShingle Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
Vale, Karliane Medeiros Ovidio
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Inteligência artificial
Aprendizado de máquina
Aprendizado Semissupervisionado
Self-training
Co-training
title_short Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
title_full Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
title_fullStr Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
title_full_unstemmed Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
title_sort Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
author Vale, Karliane Medeiros Ovidio
author_facet Vale, Karliane Medeiros Ovidio
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv Santos, Araken de Medeiros
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees2.none.fl_str_mv Araújo, Daniel Sabino Amorim de
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees3.none.fl_str_mv Nascimento, Diego Silveira Costa
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.referees4.none.fl_str_mv Gorgônio, Flavius da Luz e
dc.contributor.referees4ID.pt_BR.fl_str_mv
dc.contributor.referees5.none.fl_str_mv Abreu, Marjory Cristiany da Costa
dc.contributor.referees5ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv Vale, Karliane Medeiros Ovidio
dc.contributor.advisor1.fl_str_mv Canuto, Anne Magaly de Paula
contributor_str_mv Canuto, Anne Magaly de Paula
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Inteligência artificial
Aprendizado de máquina
Aprendizado Semissupervisionado
Self-training
Co-training
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado de máquina
Aprendizado Semissupervisionado
Self-training
Co-training
description O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos.
publishDate 2019
dc.date.issued.fl_str_mv 2019-11-22
dc.date.accessioned.fl_str_mv 2020-02-11T16:39:59Z
dc.date.available.fl_str_mv 2020-02-11T16:39:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/28464
identifier_str_mv VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.
url https://repositorio.ufrn.br/jspui/handle/123456789/28464
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/28464/2/Propostaautomatizacaoprocesso_Vale_2019.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/28464/3/Propostaautomatizacaoprocesso_Vale_2019.pdf.jpg
https://repositorio.ufrn.br/bitstream/123456789/28464/1/Propostaautomatizacaoprocesso_Vale_2019.pdf
bitstream.checksum.fl_str_mv d7331f0888eeae7e377d5fb201e0c461
eb0c3707c75e2aa5df5c418a7f204a11
8dae722c2469f9366804448060965c5a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117619582500864