Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/33968 |
Resumo: | O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream. |
id |
UFRN_99307d4da1b05303c91641bd61490d63 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/33968 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Lima, Bruno Vicente Alves dehttp://lattes.cnpq.br/6744627108761351http://lattes.cnpq.br/1987295209521433Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Silva, Ivan Nunes dahttp://lattes.cnpq.br/0448891472280429Melo, Jorge Dantas dehttp://lattes.cnpq.br/7325007451912598Machado, Vinicius Pontehttp://lattes.cnpq.br/9385561556243194Doria Neto, Adrião Duarte2021-09-17T15:48:57Z2021-09-17T15:48:57Z2021-06-09LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/33968O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.Universidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilSemissupervisionadoDeep LearningRotulaçãoAgrupamentoClassificaçãoTeoria da InformaçãoAprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAprendizagemsemissupervisionadameio_Lima_2021.pdfapplication/pdf34864220https://repositorio.ufrn.br/bitstream/123456789/33968/1/Aprendizagemsemissupervisionadameio_Lima_2021.pdf6300a28ecb92b8e6cc30aa298e0acd49MD51123456789/339682022-05-02 12:30:55.062oai:https://repositorio.ufrn.br:123456789/33968Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-05-02T15:30:55Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
title |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
spellingShingle |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação Lima, Bruno Vicente Alves de Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
title_short |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
title_full |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
title_fullStr |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
title_full_unstemmed |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
title_sort |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
author |
Lima, Bruno Vicente Alves de |
author_facet |
Lima, Bruno Vicente Alves de |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6744627108761351 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1987295209521433 |
dc.contributor.referees1.none.fl_str_mv |
Araújo, Daniel Sabino Amorim de |
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4744754780165354 |
dc.contributor.referees2.none.fl_str_mv |
Silva, Ivan Nunes da |
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0448891472280429 |
dc.contributor.referees3.none.fl_str_mv |
Melo, Jorge Dantas de |
dc.contributor.referees3Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7325007451912598 |
dc.contributor.referees4.none.fl_str_mv |
Machado, Vinicius Ponte |
dc.contributor.referees4Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9385561556243194 |
dc.contributor.author.fl_str_mv |
Lima, Bruno Vicente Alves de |
dc.contributor.advisor1.fl_str_mv |
Doria Neto, Adrião Duarte |
contributor_str_mv |
Doria Neto, Adrião Duarte |
dc.subject.por.fl_str_mv |
Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
topic |
Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
description |
O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-09-17T15:48:57Z |
dc.date.available.fl_str_mv |
2021-09-17T15:48:57Z |
dc.date.issued.fl_str_mv |
2021-06-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/33968 |
identifier_str_mv |
LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
url |
https://repositorio.ufrn.br/handle/123456789/33968 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/33968/1/Aprendizagemsemissupervisionadameio_Lima_2021.pdf |
bitstream.checksum.fl_str_mv |
6300a28ecb92b8e6cc30aa298e0acd49 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814833050341605376 |