Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem

Detalhes bibliográficos
Autor(a) principal: Araújo, Hygor Xavier
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFJF
Texto Completo: https://repositorio.ufjf.br/jspui/handle/ufjf/11434
Resumo: Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos.
id UFJF_124a5a5643814fbaeae4c79aa514d144
oai_identifier_str oai:hermes.cpd.ufjf.br:ufjf/11434
network_acronym_str UFJF
network_name_str Repositório Institucional da UFJF
repository_id_str
spelling Villela, Saulo Moraeshttp://lattes.cnpq.br/3358075178615535Neto, Raul Fonsecahttp://lattes.cnpq.br/3572434390881704Borges, Carlos Cristiano Hasencleverhttp://lattes.cnpq.br/2487554612123446Leite, Saul de Castrohttp://lattes.cnpq.br/4802548698016081http://lattes.cnpq.br/0828227674843056Araújo, Hygor Xavier2019-12-18T13:12:02Z2019-12-102019-12-18T13:12:02Z2019-09-05https://repositorio.ufjf.br/jspui/handle/ufjf/11434Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos.To solve the classification problem through the transductive inference, it is necessary to find the labels of a previously defined set. However, computing the best labeling of these samples is an NP-hard combinatorial problem. In this work, a method that combines the branch-and-bound and the best-first search methods is proposed to solve the labeling problem by searching for the optimal solution. To guide the search, margin-based classifiers, such as the Support Vector Machine (SVM), and a monotone evaluation function based on the margin values of this classifier were used, leading to the optimal global solution. To deal with the high computational cost of the maximum margin solution, we also propose a heuristic solution that is used as a lower bound, being computed in constant time by solving a classification problem with SVM. Comparing our method with the Transductive Support Vector Machine (TSVM), the results showed significant improvements in the runtime and higher margin values. Furthermore, two new heuristics are presented to reduce the number of explored states and speed up the exploration of the search space. The method and its heuristics are evaluated and compared to SVM and TSVM, showing competitive results.porUniversidade Federal de Juiz de Fora (UFJF)Programa de Pós-graduação em Ciência da ComputaçãoUFJFBrasilICE – Instituto de Ciências ExatasAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOInferência transdutivaAprendizado semissupervisionadoBusca ordenada admissívelMáquina de vetores suporteSeparação de baixa densidadeTransductive inferenceSemi-supervised learningBest-first searchSupport vector machineLow density separationUma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margeminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFORIGINALhygorxavieraraujo.pdfhygorxavieraraujo.pdfapplication/pdf528199https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/1/hygorxavieraraujo.pdfc211ee550e22cd757e649a2f3e6007a8MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53TEXThygorxavieraraujo.pdf.txthygorxavieraraujo.pdf.txtExtracted texttext/plain100987https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/4/hygorxavieraraujo.pdf.txte975fbf6519cc4d413a7c8711c8f79c4MD54THUMBNAILhygorxavieraraujo.pdf.jpghygorxavieraraujo.pdf.jpgGenerated Thumbnailimage/jpeg1159https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/5/hygorxavieraraujo.pdf.jpg64fb6927be8c47a06bc8a0d2ea68c769MD55ufjf/114342019-12-19 04:08:04.669oai:hermes.cpd.ufjf.br:ufjf/11434Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2019-12-19T06:08:04Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false
dc.title.pt_BR.fl_str_mv Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
title Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
spellingShingle Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
Araújo, Hygor Xavier
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Inferência transdutiva
Aprendizado semissupervisionado
Busca ordenada admissível
Máquina de vetores suporte
Separação de baixa densidade
Transductive inference
Semi-supervised learning
Best-first search
Support vector machine
Low density separation
title_short Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
title_full Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
title_fullStr Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
title_full_unstemmed Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
title_sort Uma busca ordenada branch-and-bound para solução do problema de classificação semissupervisionada usando classificadores de larga margem
author Araújo, Hygor Xavier
author_facet Araújo, Hygor Xavier
author_role author
dc.contributor.advisor1.fl_str_mv Villela, Saulo Moraes
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3358075178615535
dc.contributor.advisor-co1.fl_str_mv Neto, Raul Fonseca
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3572434390881704
dc.contributor.referee1.fl_str_mv Borges, Carlos Cristiano Hasenclever
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/2487554612123446
dc.contributor.referee2.fl_str_mv Leite, Saul de Castro
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/4802548698016081
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0828227674843056
dc.contributor.author.fl_str_mv Araújo, Hygor Xavier
contributor_str_mv Villela, Saulo Moraes
Neto, Raul Fonseca
Borges, Carlos Cristiano Hasenclever
Leite, Saul de Castro
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Inferência transdutiva
Aprendizado semissupervisionado
Busca ordenada admissível
Máquina de vetores suporte
Separação de baixa densidade
Transductive inference
Semi-supervised learning
Best-first search
Support vector machine
Low density separation
dc.subject.por.fl_str_mv Inferência transdutiva
Aprendizado semissupervisionado
Busca ordenada admissível
Máquina de vetores suporte
Separação de baixa densidade
Transductive inference
Semi-supervised learning
Best-first search
Support vector machine
Low density separation
description Para a solução do problema de classificação através da inferência transdutiva, é necessário encontrar os rótulos de um conjunto previamente definido. No entanto, calcular a melhor rotulação dessas amostras é um problema combinatorial NP-difícil. Neste trabalho, um método que combina os métodos de busca branch-and-bound e best-first é proposto para resolver o problema de rotulação buscando pela solução ótima. Para orientar a busca, foram usados classificadores baseados em margem, como a Máquina de Vetores Suporte (Support Vector Machine – SVM), e uma função de avaliação monótona com base nos valores de margem deste classificador, o que leva á solução globalmente ótima. Para lidar com o alto custo computacional da solução de máxima margem, também foi proposta uma solução heurística que é usada como um limite inferior sendo computado em tempo constante através da solução de um problema de classificação com o SVM. Comparando o método proposto com a Máquina de Vetores Suporte Transdutiva (Transductive Support Vector Machine – TSVM), os resultados mostraram melhorias significativas no tempo de execução e valores superiores de margem. Além disso, duas novas heurísticas são apresentadas para reduzir o número de estados explorados e acelerar a exploração do espaço de busca. O método e suas heurísticas são avaliados e comparados ao SVM e ao TSVM, mostrando resultados competitivos.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-12-18T13:12:02Z
dc.date.available.fl_str_mv 2019-12-10
2019-12-18T13:12:02Z
dc.date.issued.fl_str_mv 2019-09-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufjf.br/jspui/handle/ufjf/11434
url https://repositorio.ufjf.br/jspui/handle/ufjf/11434
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFJF
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICE – Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFJF
instname:Universidade Federal de Juiz de Fora (UFJF)
instacron:UFJF
instname_str Universidade Federal de Juiz de Fora (UFJF)
instacron_str UFJF
institution UFJF
reponame_str Repositório Institucional da UFJF
collection Repositório Institucional da UFJF
bitstream.url.fl_str_mv https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/1/hygorxavieraraujo.pdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/2/license_rdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/3/license.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/4/hygorxavieraraujo.pdf.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/11434/5/hygorxavieraraujo.pdf.jpg
bitstream.checksum.fl_str_mv c211ee550e22cd757e649a2f3e6007a8
4d2950bda3d176f570a9f8b328dfbbef
8a4605be74aa9ea9d79846c1fba20a33
e975fbf6519cc4d413a7c8711c8f79c4
64fb6927be8c47a06bc8a0d2ea68c769
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)
repository.mail.fl_str_mv
_version_ 1793962338206875648