Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas

Detalhes bibliográficos
Autor(a) principal: Pedro Henrique Silva Souza Barros
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/40039
https://orcid.org/0000-0001-6606-0135
Resumo: No presente trabalho, propomos um novo método de aprendizagem métrica profunda que diferentemente de muitos trabalhos nesta área, define um novo espaço latente obtido por meio de um autoencoder. O novo espaço, chamado de espaço S, é dividido em diferentes regiões que descrevem as posições onde pares de objetos são similares/dissimilares. Localizamos marcadores para identificar essas regiões. Em seguida, estimamos as semelhanças entre objetos por meio de uma distribuição t-student baseada em kernel para medir a distância dos marcadores e a nova representação de dados. Assim, estimamos simultaneamente a posição dos marcadores no espaço S e representamos os objetos no mesmo espaço em nossa abordagem. Além disso, propomos uma nova função de regularização para evitar que marcadores similares entrem em colapso. Apresentamos evidências de que nossa proposta pode representar espaços complexos, por exemplo, quando grupos de objetos semelhantes estão localizados em regiões disjuntas. Comparamos nossa proposta com 9 abordagens diferentes de aprendizagem métrica a distância (quatro delas são baseadas em aprendizagem profunda) em 28 conjuntos de dados heterogêneos do mundo real. De acordo com as quatro métricas quantitativas utilizadas, nosso método supera todas as nove estratégias da literatura. Além disso, investigamos alguns estudos de caso em diferentes domínios, para verificar a eficácia de nossa proposta.
id UFMG_1e60c285f3738a67b142dc0520a2f689
oai_identifier_str oai:repositorio.ufmg.br:1843/40039
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Heitor Soares Ramos Filhohttp://lattes.cnpq.br/4978869867640619Fabiane da Silva QueirozGisele Lobo PappaAlejandro Cesar Frery Orgambidehttp://lattes.cnpq.br/3310055196036260Pedro Henrique Silva Souza Barros2022-03-11T21:51:42Z2022-03-11T21:51:42Z2021-03-05http://hdl.handle.net/1843/40039https://orcid.org/0000-0001-6606-0135No presente trabalho, propomos um novo método de aprendizagem métrica profunda que diferentemente de muitos trabalhos nesta área, define um novo espaço latente obtido por meio de um autoencoder. O novo espaço, chamado de espaço S, é dividido em diferentes regiões que descrevem as posições onde pares de objetos são similares/dissimilares. Localizamos marcadores para identificar essas regiões. Em seguida, estimamos as semelhanças entre objetos por meio de uma distribuição t-student baseada em kernel para medir a distância dos marcadores e a nova representação de dados. Assim, estimamos simultaneamente a posição dos marcadores no espaço S e representamos os objetos no mesmo espaço em nossa abordagem. Além disso, propomos uma nova função de regularização para evitar que marcadores similares entrem em colapso. Apresentamos evidências de que nossa proposta pode representar espaços complexos, por exemplo, quando grupos de objetos semelhantes estão localizados em regiões disjuntas. Comparamos nossa proposta com 9 abordagens diferentes de aprendizagem métrica a distância (quatro delas são baseadas em aprendizagem profunda) em 28 conjuntos de dados heterogêneos do mundo real. De acordo com as quatro métricas quantitativas utilizadas, nosso método supera todas as nove estratégias da literatura. Além disso, investigamos alguns estudos de caso em diferentes domínios, para verificar a eficácia de nossa proposta.We propose a novel deep metric learning method. Differently from many works in this area, we defined a novel latent space obtained through an autoencoder. The new space, namely S-space, is divided into different regions that describe the positions where pairs of objects are similar/dissimilar. We locate makers to identify these regions. We estimate the similarities between objects through a kernel-based t-student distribution to measure the markers' distance and the new data representation. We simultaneously estimate the markers' position in the S-space and represent the objects in the same space in our approach. Moreover, we propose a new regularization function to avoid similar markers to collapse altogether. We present evidence that our proposal can represent complex spaces, for instance, when groups of similar objects are located in disjoint regions. We compare our proposal to 9 different distance metric learning approaches (four of them are based on deep-learning) on 28 real-world heterogeneous datasets. According to the four quantitative metrics used, our method overcomes all the nine strategies from the literature. In addition, we investigated some case studies in different domains, to verify the effectiveness of our proposal.CNPq - Conselho Nacional de Desenvolvimento Científico e TecnológicoengUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Ciência da ComputaçãoUFMGBrasilICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOComputação - TesesAprendizado profundo - TesesRedes neurais (Computação) - TesesDeep metric learningSimilarity spaceneural networksimilar markersUm novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundasA new similarity space tailored for supervised deep metric learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertacao0novo_final (1).pdfdissertacao0novo_final (1).pdfapplication/pdf8005232https://repositorio.ufmg.br/bitstream/1843/40039/8/dissertacao0novo_final%20%281%29.pdf87bcfa973d8a9f36c2cea849d76d682eMD58LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/40039/9/license.txtcda590c95a0b51b4d15f60c9642ca272MD591843/400392022-03-11 18:51:42.88oai:repositorio.ufmg.br:1843/40039TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2022-03-11T21:51:42Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
dc.title.alternative.pt_BR.fl_str_mv A new similarity space tailored for supervised deep metric learning
title Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
spellingShingle Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
Pedro Henrique Silva Souza Barros
Deep metric learning
Similarity space
neural network
similar markers
Computação - Teses
Aprendizado profundo - Teses
Redes neurais (Computação) - Teses
title_short Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
title_full Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
title_fullStr Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
title_full_unstemmed Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
title_sort Um novo espaço de similaridade projetado para o aprendizado supervisionado de métricas profundas
author Pedro Henrique Silva Souza Barros
author_facet Pedro Henrique Silva Souza Barros
author_role author
dc.contributor.advisor1.fl_str_mv Heitor Soares Ramos Filho
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4978869867640619
dc.contributor.advisor-co1.fl_str_mv Fabiane da Silva Queiroz
dc.contributor.referee1.fl_str_mv Gisele Lobo Pappa
dc.contributor.referee2.fl_str_mv Alejandro Cesar Frery Orgambide
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/3310055196036260
dc.contributor.author.fl_str_mv Pedro Henrique Silva Souza Barros
contributor_str_mv Heitor Soares Ramos Filho
Fabiane da Silva Queiroz
Gisele Lobo Pappa
Alejandro Cesar Frery Orgambide
dc.subject.por.fl_str_mv Deep metric learning
Similarity space
neural network
similar markers
topic Deep metric learning
Similarity space
neural network
similar markers
Computação - Teses
Aprendizado profundo - Teses
Redes neurais (Computação) - Teses
dc.subject.other.pt_BR.fl_str_mv Computação - Teses
Aprendizado profundo - Teses
Redes neurais (Computação) - Teses
description No presente trabalho, propomos um novo método de aprendizagem métrica profunda que diferentemente de muitos trabalhos nesta área, define um novo espaço latente obtido por meio de um autoencoder. O novo espaço, chamado de espaço S, é dividido em diferentes regiões que descrevem as posições onde pares de objetos são similares/dissimilares. Localizamos marcadores para identificar essas regiões. Em seguida, estimamos as semelhanças entre objetos por meio de uma distribuição t-student baseada em kernel para medir a distância dos marcadores e a nova representação de dados. Assim, estimamos simultaneamente a posição dos marcadores no espaço S e representamos os objetos no mesmo espaço em nossa abordagem. Além disso, propomos uma nova função de regularização para evitar que marcadores similares entrem em colapso. Apresentamos evidências de que nossa proposta pode representar espaços complexos, por exemplo, quando grupos de objetos semelhantes estão localizados em regiões disjuntas. Comparamos nossa proposta com 9 abordagens diferentes de aprendizagem métrica a distância (quatro delas são baseadas em aprendizagem profunda) em 28 conjuntos de dados heterogêneos do mundo real. De acordo com as quatro métricas quantitativas utilizadas, nosso método supera todas as nove estratégias da literatura. Além disso, investigamos alguns estudos de caso em diferentes domínios, para verificar a eficácia de nossa proposta.
publishDate 2021
dc.date.issued.fl_str_mv 2021-03-05
dc.date.accessioned.fl_str_mv 2022-03-11T21:51:42Z
dc.date.available.fl_str_mv 2022-03-11T21:51:42Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/40039
dc.identifier.orcid.pt_BR.fl_str_mv https://orcid.org/0000-0001-6606-0135
url http://hdl.handle.net/1843/40039
https://orcid.org/0000-0001-6606-0135
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/40039/8/dissertacao0novo_final%20%281%29.pdf
https://repositorio.ufmg.br/bitstream/1843/40039/9/license.txt
bitstream.checksum.fl_str_mv 87bcfa973d8a9f36c2cea849d76d682e
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589355311202304