Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte
Autor(a) principal: | |
---|---|
Data de Publicação: | 2008 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUOS-8D7FF8 |
Resumo: | O paradigma de Aprendizado Semi-Supervisionado é bastante adequado a uma classe de problemas de crescente relevância no contexto do Aprendizado de Máquinas: aqueles onde há um grande desbalanceamento entre o conjunto de treinamento e o de teste, devido, entre outras coisas, ao alto custo de um classificador. Nessa classe de problemas, não se pode assegurar que os padrões rotulados representem adequadamente o sistema a ser aprendido, restringindo o uso do paradigma Indutivo Supervisionado. Utilizam-se, então, os padrões não-rotulados como fonte alternativa de informação sobre o problema a ser resolvido, garantindo maior capacidade de generalização à solução obtida. As Máquinas de Vetores de Suporte (SVMs) são Redes Neurais Artificiais de ampla aceitação pela comunidade de Inteligência Computacional. Sua formulação baseada na Teoria do Aprendizado Estatístico e na maximização da margem de separação confere às SVMs altíssima capacidade de generalização. As TSVMs (Transductive Support Vector Machines) ampliam a formulação das SVMs para a aplicação em problemas de aprendizado Semi-Supervisionado. Entretanto, a procura pelo conjunto de classificações que maximiza a margem de separação entre ambos os conjuntos de treinamento e de teste é realizada através de uma busca local exaustiva. A não-otimalidade desse processo motivou o desenvolvimento das GA3SVMs (Genetic Algorithm Semi-Supervised Support Vector Machines), propostas no presente trabalho. Introduz-se, aqui, um Algoritmo Evolucionário na busca pelas classificações ótimas para os padrões de teste, de forma a induzir uma solução de separação máxima e alta capacidade de generalização. Um operador de mutação modificado, inspirado no método transdutivo k-Nearest Neighbors, é também apresentado, o qual adiciona informação ao processo de busca e acelera significativamente a convergência do Algoritmo Genético utilizado. Os resultados obtidos mostram a superioridade da metodologia proposta quando comparada às TSVMs tradicionais, para a classe de problemas estudada. |
id |
UFMG_bfcd1bcccfecab6bc69762aeff7def6a |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUOS-8D7FF8 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Antonio de Padua BragaMarcelo Mourao Silva2019-08-10T17:09:52Z2019-08-10T17:09:52Z2008-11-21http://hdl.handle.net/1843/BUOS-8D7FF8O paradigma de Aprendizado Semi-Supervisionado é bastante adequado a uma classe de problemas de crescente relevância no contexto do Aprendizado de Máquinas: aqueles onde há um grande desbalanceamento entre o conjunto de treinamento e o de teste, devido, entre outras coisas, ao alto custo de um classificador. Nessa classe de problemas, não se pode assegurar que os padrões rotulados representem adequadamente o sistema a ser aprendido, restringindo o uso do paradigma Indutivo Supervisionado. Utilizam-se, então, os padrões não-rotulados como fonte alternativa de informação sobre o problema a ser resolvido, garantindo maior capacidade de generalização à solução obtida. As Máquinas de Vetores de Suporte (SVMs) são Redes Neurais Artificiais de ampla aceitação pela comunidade de Inteligência Computacional. Sua formulação baseada na Teoria do Aprendizado Estatístico e na maximização da margem de separação confere às SVMs altíssima capacidade de generalização. As TSVMs (Transductive Support Vector Machines) ampliam a formulação das SVMs para a aplicação em problemas de aprendizado Semi-Supervisionado. Entretanto, a procura pelo conjunto de classificações que maximiza a margem de separação entre ambos os conjuntos de treinamento e de teste é realizada através de uma busca local exaustiva. A não-otimalidade desse processo motivou o desenvolvimento das GA3SVMs (Genetic Algorithm Semi-Supervised Support Vector Machines), propostas no presente trabalho. Introduz-se, aqui, um Algoritmo Evolucionário na busca pelas classificações ótimas para os padrões de teste, de forma a induzir uma solução de separação máxima e alta capacidade de generalização. Um operador de mutação modificado, inspirado no método transdutivo k-Nearest Neighbors, é também apresentado, o qual adiciona informação ao processo de busca e acelera significativamente a convergência do Algoritmo Genético utilizado. Os resultados obtidos mostram a superioridade da metodologia proposta quando comparada às TSVMs tradicionais, para a classe de problemas estudada.The Semi-Supervised Learning paradigm is highly adequate for a class of problems with growing relevance in the context of Machine Learning: those in which there is a large unbalance between the training and the test data sets due to, among other things, the high cost of a classifier. In such class of problems, one cannot ensure that the labeled patterns appropriately represent the system to be learned, limiting the applicability of the Supervised Inductive paradigm. The unlabeled patterns are then used as an additional source of information about the problem being solved, providing increased generalization ability to the achieved solution. The Support Vector Machines (SVMs) are Artificial Neural Networks widely accepted among the Computational Intelligence community. The formulation based on the Statistical Learning Theory and on the separating margin maximization provides the SVMs with extremely high generalization ability. The TSVMs (Transductive Support Vector Machines) extend the SVMs formulation to the context of Semi-Supervised Learning. However, the search for the set of labels that maximize the separating margin between both the training and the test data is therein performed through an exhaustive local search. The non-optimality of such process motivates the development of the GA3SVMs (Genetic Algorithm Semi-Supervised Support Vector Machines), proposed in this piece. An Evolutionary Algorithm is introduced in the search for the optima classifications for the test patterns, inducing a solution with maximum separating margin and high generalization ability. A modified mutation operator, based on the k-Nearest Neighbors transductive method, is also presented, which adds information to the search process and speeds up convergence significantly for the used Genetic Algorithm. Obtained results show the superiority of the proposed approach compared to the traditional TSVMs, for the class of problems studied.Universidade Federal de Minas GeraisUFMGEngenharia elétricaEngenharia elétricaUma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporteinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALmarcelo_mour_o_silva.pdfapplication/pdf914943https://repositorio.ufmg.br/bitstream/1843/BUOS-8D7FF8/1/marcelo_mour_o_silva.pdfa8bce82fba007131cfc09f43e7d6d632MD51TEXTmarcelo_mour_o_silva.pdf.txtmarcelo_mour_o_silva.pdf.txtExtracted texttext/plain156707https://repositorio.ufmg.br/bitstream/1843/BUOS-8D7FF8/2/marcelo_mour_o_silva.pdf.txt0184e0630d40086928af75662da1cc38MD521843/BUOS-8D7FF82019-11-14 03:16:51.355oai:repositorio.ufmg.br:1843/BUOS-8D7FF8Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:16:51Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
title |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
spellingShingle |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte Marcelo Mourao Silva Engenharia elétrica Engenharia elétrica |
title_short |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
title_full |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
title_fullStr |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
title_full_unstemmed |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
title_sort |
Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte |
author |
Marcelo Mourao Silva |
author_facet |
Marcelo Mourao Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Antonio de Padua Braga |
dc.contributor.author.fl_str_mv |
Marcelo Mourao Silva |
contributor_str_mv |
Antonio de Padua Braga |
dc.subject.por.fl_str_mv |
Engenharia elétrica |
topic |
Engenharia elétrica Engenharia elétrica |
dc.subject.other.pt_BR.fl_str_mv |
Engenharia elétrica |
description |
O paradigma de Aprendizado Semi-Supervisionado é bastante adequado a uma classe de problemas de crescente relevância no contexto do Aprendizado de Máquinas: aqueles onde há um grande desbalanceamento entre o conjunto de treinamento e o de teste, devido, entre outras coisas, ao alto custo de um classificador. Nessa classe de problemas, não se pode assegurar que os padrões rotulados representem adequadamente o sistema a ser aprendido, restringindo o uso do paradigma Indutivo Supervisionado. Utilizam-se, então, os padrões não-rotulados como fonte alternativa de informação sobre o problema a ser resolvido, garantindo maior capacidade de generalização à solução obtida. As Máquinas de Vetores de Suporte (SVMs) são Redes Neurais Artificiais de ampla aceitação pela comunidade de Inteligência Computacional. Sua formulação baseada na Teoria do Aprendizado Estatístico e na maximização da margem de separação confere às SVMs altíssima capacidade de generalização. As TSVMs (Transductive Support Vector Machines) ampliam a formulação das SVMs para a aplicação em problemas de aprendizado Semi-Supervisionado. Entretanto, a procura pelo conjunto de classificações que maximiza a margem de separação entre ambos os conjuntos de treinamento e de teste é realizada através de uma busca local exaustiva. A não-otimalidade desse processo motivou o desenvolvimento das GA3SVMs (Genetic Algorithm Semi-Supervised Support Vector Machines), propostas no presente trabalho. Introduz-se, aqui, um Algoritmo Evolucionário na busca pelas classificações ótimas para os padrões de teste, de forma a induzir uma solução de separação máxima e alta capacidade de generalização. Um operador de mutação modificado, inspirado no método transdutivo k-Nearest Neighbors, é também apresentado, o qual adiciona informação ao processo de busca e acelera significativamente a convergência do Algoritmo Genético utilizado. Os resultados obtidos mostram a superioridade da metodologia proposta quando comparada às TSVMs tradicionais, para a classe de problemas estudada. |
publishDate |
2008 |
dc.date.issued.fl_str_mv |
2008-11-21 |
dc.date.accessioned.fl_str_mv |
2019-08-10T17:09:52Z |
dc.date.available.fl_str_mv |
2019-08-10T17:09:52Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUOS-8D7FF8 |
url |
http://hdl.handle.net/1843/BUOS-8D7FF8 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/BUOS-8D7FF8/1/marcelo_mour_o_silva.pdf https://repositorio.ufmg.br/bitstream/1843/BUOS-8D7FF8/2/marcelo_mour_o_silva.pdf.txt |
bitstream.checksum.fl_str_mv |
a8bce82fba007131cfc09f43e7d6d632 0184e0630d40086928af75662da1cc38 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1801676802510290944 |