Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação

Detalhes bibliográficos
Autor(a) principal: Lima, Bruno Vicente Alves de
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/33968
Resumo: O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.
id UFRN_99307d4da1b05303c91641bd61490d63
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/33968
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Lima, Bruno Vicente Alves dehttp://lattes.cnpq.br/6744627108761351http://lattes.cnpq.br/1987295209521433Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Silva, Ivan Nunes dahttp://lattes.cnpq.br/0448891472280429Melo, Jorge Dantas dehttp://lattes.cnpq.br/7325007451912598Machado, Vinicius Pontehttp://lattes.cnpq.br/9385561556243194Doria Neto, Adrião Duarte2021-09-17T15:48:57Z2021-09-17T15:48:57Z2021-06-09LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/33968O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilSemissupervisionadoDeep LearningRotulaçãoAgrupamentoClassificaçãoTeoria da InformaçãoAprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAprendizagemsemissupervisionadameio_Lima_2021.pdfapplication/pdf34864220https://repositorio.ufrn.br/bitstream/123456789/33968/1/Aprendizagemsemissupervisionadameio_Lima_2021.pdf6300a28ecb92b8e6cc30aa298e0acd49MD51123456789/339682022-05-02 12:30:55.062oai:https://repositorio.ufrn.br:123456789/33968Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-05-02T15:30:55Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
spellingShingle Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
Lima, Bruno Vicente Alves de
Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
title_short Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_full Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_fullStr Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_full_unstemmed Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_sort Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
author Lima, Bruno Vicente Alves de
author_facet Lima, Bruno Vicente Alves de
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6744627108761351
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1987295209521433
dc.contributor.referees1.none.fl_str_mv Araújo, Daniel Sabino Amorim de
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4744754780165354
dc.contributor.referees2.none.fl_str_mv Silva, Ivan Nunes da
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0448891472280429
dc.contributor.referees3.none.fl_str_mv Melo, Jorge Dantas de
dc.contributor.referees3Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7325007451912598
dc.contributor.referees4.none.fl_str_mv Machado, Vinicius Ponte
dc.contributor.referees4Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9385561556243194
dc.contributor.author.fl_str_mv Lima, Bruno Vicente Alves de
dc.contributor.advisor1.fl_str_mv Doria Neto, Adrião Duarte
contributor_str_mv Doria Neto, Adrião Duarte
dc.subject.por.fl_str_mv Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
topic Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
description O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-09-17T15:48:57Z
dc.date.available.fl_str_mv 2021-09-17T15:48:57Z
dc.date.issued.fl_str_mv 2021-06-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/33968
identifier_str_mv LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/33968
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/33968/1/Aprendizagemsemissupervisionadameio_Lima_2021.pdf
bitstream.checksum.fl_str_mv 6300a28ecb92b8e6cc30aa298e0acd49
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814833050341605376