Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/jspui/handle/123456789/28464 |
Resumo: | O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos. |
id |
UFRN_fa9dcccdc2b230ce5bc70c82e1b35980 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/28464 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Vale, Karliane Medeiros OvidioSantos, Araken de MedeirosAraújo, Daniel Sabino Amorim deNascimento, Diego Silveira CostaGorgônio, Flavius da Luz eAbreu, Marjory Cristiany da CostaCanuto, Anne Magaly de Paula2020-02-11T16:39:59Z2020-02-11T16:39:59Z2019-11-22VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019.https://repositorio.ufrn.br/jspui/handle/123456789/28464O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos.Semi-supervised learning is a kind of machine learning that integrates supervised and unsupervised learning mechanisms. In this type of learning, most of training set labels are unknown, while there is a small part of data that has known labels. The semi-supervised learning is attractive because of its potential to use labeled and unlabeled data to perform better than supervised learning. This paper consists of a study in the field of semisupervised learning and implements changes on the self-training and co-training semisupervised learning algorithms. In the literature, it is common to develop researches that change the structure of such algorithms, however, none of them proposes automating the labeling process of unlabeled instances, which is the main purpose of this work. In order to achieve this goal, three methods are proposed: FlexCon-G, FlexCon e FlexCon-C. The main difference among these methods is how tje confidence rate is calculated and the strategy used to choose a label in each iteration, among them ensembles. In order to evaluate the proposed methods’ performance, we have carried out an empirical analysis, in which the performances of these methods have been evaluated on 30 datasets with diversified characteristics. The obtained results indicate that the three proposed methods perform better than original self-training and co-training methods in most cases.CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOInteligência artificialAprendizado de máquinaAprendizado SemissupervisionadoSelf-trainingCo-trainingUma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionadoA proposal for automating the instance labeling process in semi-supervised learning algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTPropostaautomatizacaoprocesso_Vale_2019.pdf.txtPropostaautomatizacaoprocesso_Vale_2019.pdf.txtExtracted texttext/plain256292https://repositorio.ufrn.br/bitstream/123456789/28464/2/Propostaautomatizacaoprocesso_Vale_2019.pdf.txtd7331f0888eeae7e377d5fb201e0c461MD52THUMBNAILPropostaautomatizacaoprocesso_Vale_2019.pdf.jpgPropostaautomatizacaoprocesso_Vale_2019.pdf.jpgGenerated Thumbnailimage/jpeg1264https://repositorio.ufrn.br/bitstream/123456789/28464/3/Propostaautomatizacaoprocesso_Vale_2019.pdf.jpgeb0c3707c75e2aa5df5c418a7f204a11MD53ORIGINALPropostaautomatizacaoprocesso_Vale_2019.pdfapplication/pdf1962883https://repositorio.ufrn.br/bitstream/123456789/28464/1/Propostaautomatizacaoprocesso_Vale_2019.pdf8dae722c2469f9366804448060965c5aMD51123456789/284642020-02-16 04:54:54.622oai:https://repositorio.ufrn.br:123456789/28464Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2020-02-16T07:54:54Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
dc.title.alternative.pt_BR.fl_str_mv |
A proposal for automating the instance labeling process in semi-supervised learning algorithms |
title |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
spellingShingle |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado Vale, Karliane Medeiros Ovidio CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Inteligência artificial Aprendizado de máquina Aprendizado Semissupervisionado Self-training Co-training |
title_short |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
title_full |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
title_fullStr |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
title_full_unstemmed |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
title_sort |
Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado |
author |
Vale, Karliane Medeiros Ovidio |
author_facet |
Vale, Karliane Medeiros Ovidio |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
|
dc.contributor.advisorID.pt_BR.fl_str_mv |
|
dc.contributor.referees1.none.fl_str_mv |
Santos, Araken de Medeiros |
dc.contributor.referees1ID.pt_BR.fl_str_mv |
|
dc.contributor.referees2.none.fl_str_mv |
Araújo, Daniel Sabino Amorim de |
dc.contributor.referees2ID.pt_BR.fl_str_mv |
|
dc.contributor.referees3.none.fl_str_mv |
Nascimento, Diego Silveira Costa |
dc.contributor.referees3ID.pt_BR.fl_str_mv |
|
dc.contributor.referees4.none.fl_str_mv |
Gorgônio, Flavius da Luz e |
dc.contributor.referees4ID.pt_BR.fl_str_mv |
|
dc.contributor.referees5.none.fl_str_mv |
Abreu, Marjory Cristiany da Costa |
dc.contributor.referees5ID.pt_BR.fl_str_mv |
|
dc.contributor.author.fl_str_mv |
Vale, Karliane Medeiros Ovidio |
dc.contributor.advisor1.fl_str_mv |
Canuto, Anne Magaly de Paula |
contributor_str_mv |
Canuto, Anne Magaly de Paula |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Inteligência artificial Aprendizado de máquina Aprendizado Semissupervisionado Self-training Co-training |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado de máquina Aprendizado Semissupervisionado Self-training Co-training |
description |
O aprendizado semissupervisionado é um tipo de aprendizado de máquina que integra os mecanismos de aprendizado supervisionado e não supervisionado. Nele, a maioria dos rótulos do conjunto de treinamento são desconhecidos, mas há uma pequena parcela que possui rótulo. Este tipo de aprendizado atrai atenção devido ao seu potencial de utilização de dados rotulados e não rotulados para alcançar melhor desempenho do que o aprendizado supervisionado. Este trabalho consiste em um estudo no campo da aprendizagem semissupervisionada e implementa mudanças na estrutura de dois algoritmos semissupervisionados, self-training e co-training. Na literatura, é comum o desenvolvimento de pesquisas que alteram a estrutura destes algoritmos, no entanto, nenhuma delas propõe a automatização no processo de rotulagem de instâncias não rotuladas, que é o principal propósito deste trabalho. Para atingir este objetivo, três métodos são propostos: FlexConG, FlexCon e FlexCon-C. As principais diferenças entre estes métodos são a forma de calcular o limiar de confiança e a estratégia para escolha dos rótulos a cada iteração, entre elas comitês de classificadores. Para avaliar a performance dos métodos propostos, foi realizada uma análise empírica em que o desempenho destes métodos foi avaliado em 30 conjuntos de dados com características diversificadas. Os resultados indicam que os três métodos propostos e suas versões apresentam melhor desempenho que os métodos self-training e co-training originais na maioria dos casos. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-22 |
dc.date.accessioned.fl_str_mv |
2020-02-11T16:39:59Z |
dc.date.available.fl_str_mv |
2020-02-11T16:39:59Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/jspui/handle/123456789/28464 |
identifier_str_mv |
VALE, Karliane Medeiros Ovidio. Uma proposta de automatização do processo de rotulagem de instâncias em algoritmos de aprendizado semissupervisionado. 2019. 117f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2019. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/28464 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/28464/2/Propostaautomatizacaoprocesso_Vale_2019.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/28464/3/Propostaautomatizacaoprocesso_Vale_2019.pdf.jpg https://repositorio.ufrn.br/bitstream/123456789/28464/1/Propostaautomatizacaoprocesso_Vale_2019.pdf |
bitstream.checksum.fl_str_mv |
d7331f0888eeae7e377d5fb201e0c461 eb0c3707c75e2aa5df5c418a7f204a11 8dae722c2469f9366804448060965c5a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1802117619582500864 |