Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFJF |
Texto Completo: | https://repositorio.ufjf.br/jspui/handle/ufjf/11434 |
Resumo: | Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos. |
id |
UFJF_124a5a5643814fbaeae4c79aa514d144 |
---|---|
oai_identifier_str |
oai:hermes.cpd.ufjf.br:ufjf/11434 |
network_acronym_str |
UFJF |
network_name_str |
Repositório Institucional da UFJF |
repository_id_str |
|
spelling |
Villela, Saulo Moraeshttp://lattes.cnpq.br/3358075178615535Neto, Raul Fonsecahttp://lattes.cnpq.br/3572434390881704Borges, Carlos Cristiano Hasencleverhttp://lattes.cnpq.br/2487554612123446Leite, Saul de Castrohttp://lattes.cnpq.br/4802548698016081http://lattes.cnpq.br/0828227674843056Araújo, Hygor Xavier2019-12-18T13:12:02Z2019-12-102019-12-18T13:12:02Z2019-09-05https://repositorio.ufjf.br/jspui/handle/ufjf/11434Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos.To solve the classification problem through the transductive inference, it is necessary to find the labels of a previously defined set. However, computing the best labeling of these samples is an NP-hard combinatorial problem. In this work, a method that combines the branch-and-bound and the best-first search methods is proposed to solve the labeling problem by searching for the optimal solution. To guide the search, margin-based classifiers, such as the Support Vector Machine (SVM), and a monotone evaluation function based on the margin values of this classifier were used, leading to the optimal global solution. To deal with the high computational cost of the maximum margin solution, we also propose a heuristic solution that is used as a lower bound, being computed in constant time by solving a classification problem with SVM. Comparing our method with the Transductive Support Vector Machine (TSVM), the results showed significant improvements in the runtime and higher margin values. Furthermore, two new heuristics are presented to reduce the number of explored states and speed up the exploration of the search space. The method and its heuristics are evaluated and compared to SVM and TSVM, showing competitive results.porUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Ciência da ComputaçãoUFJFBrasilICE – Instituto de Ciências ExatasAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOInferência transdutivaAprendizado semissupervisionadoBusca ordenada admissívelMáquina de vetores suporteSeparação de baixa densidadeTransductive inferenceSemi-supervised learningBest-first searchSupport vector machineLow density separationUma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margeminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALhygorxavieraraujo.pdfhygorxavieraraujo.pdfapplication/pdf528199https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/1/hygorxavieraraujo.pdfc211ee550e22cd757e649a2f3e6007a8MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXThygorxavieraraujo.pdf.txthygorxavieraraujo.pdf.txtExtracted texttext/plain100987https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/4/hygorxavieraraujo.pdf.txte975fbf6519cc4d413a7c8711c8f79c4MD54THUMBNAILhygorxavieraraujo.pdf.jpghygorxavieraraujo.pdf.jpgGenerated Thumbnailimage/jpeg1159https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/5/hygorxavieraraujo.pdf.jpg64fb6927be8c47a06bc8a0d2ea68c769MD55ufjf/114342019-12-19 04:08:04.669oai:hermes.cpd.ufjf.br:ufjf/11434Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2019-12-19T06:08:04Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false |
dc.title.pt_BR.fl_str_mv |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
title |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
spellingShingle |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem Araújo, Hygor Xavier CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Inferência transdutiva Aprendizado semissupervisionado Busca ordenada admissível Máquina de vetores suporte Separação de baixa densidade Transductive inference Semi-supervised learning Best-first search Support vector machine Low density separation |
title_short |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
title_full |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
title_fullStr |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
title_full_unstemmed |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
title_sort |
Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem |
author |
Araújo, Hygor Xavier |
author_facet |
Araújo, Hygor Xavier |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Villela, Saulo Moraes |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3358075178615535 |
dc.contributor.advisor-co1.fl_str_mv |
Neto, Raul Fonseca |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/3572434390881704 |
dc.contributor.referee1.fl_str_mv |
Borges, Carlos Cristiano Hasenclever |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/2487554612123446 |
dc.contributor.referee2.fl_str_mv |
Leite, Saul de Castro |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/4802548698016081 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0828227674843056 |
dc.contributor.author.fl_str_mv |
Araújo, Hygor Xavier |
contributor_str_mv |
Villela, Saulo Moraes Neto, Raul Fonseca Borges, Carlos Cristiano Hasenclever Leite, Saul de Castro |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Inferência transdutiva Aprendizado semissupervisionado Busca ordenada admissível Máquina de vetores suporte Separação de baixa densidade Transductive inference Semi-supervised learning Best-first search Support vector machine Low density separation |
dc.subject.por.fl_str_mv |
Inferência transdutiva Aprendizado semissupervisionado Busca ordenada admissível Máquina de vetores suporte Separação de baixa densidade Transductive inference Semi-supervised learning Best-first search Support vector machine Low density separation |
description |
Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-12-18T13:12:02Z |
dc.date.available.fl_str_mv |
2019-12-10 2019-12-18T13:12:02Z |
dc.date.issued.fl_str_mv |
2019-09-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufjf.br/jspui/handle/ufjf/11434 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/11434 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFJF |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
ICE – Instituto de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Juiz de Fora (UFJF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora (UFJF) instacron:UFJF |
instname_str |
Universidade Federal de Juiz de Fora (UFJF) |
instacron_str |
UFJF |
institution |
UFJF |
reponame_str |
Repositório Institucional da UFJF |
collection |
Repositório Institucional da UFJF |
bitstream.url.fl_str_mv |
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/1/hygorxavieraraujo.pdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/2/license_rdf https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/3/license.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/4/hygorxavieraraujo.pdf.txt https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/5/hygorxavieraraujo.pdf.jpg |
bitstream.checksum.fl_str_mv |
c211ee550e22cd757e649a2f3e6007a8 4d2950bda3d176f570a9f8b328dfbbef 8a4605be74aa9ea9d79846c1fba20a33 e975fbf6519cc4d413a7c8711c8f79c4 64fb6927be8c47a06bc8a0d2ea68c769 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF) |
repository.mail.fl_str_mv |
|
_version_ |
1793962338206875648 |