Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors

Detalhes bibliográficos
Autor(a) principal: Llerena, Jeffri Erwin Murrugarra
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/252151
Resumo: O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras.
id URGS_768ad4fe920739ca34dc5711f2bd940c
oai_identifier_str oai:www.lume.ufrgs.br:10183/252151
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Llerena, Jeffri Erwin MurrugarraJung, Claudio Rosito2022-12-01T04:53:42Z2022http://hdl.handle.net/10183/252151001154386O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras.Using localization loss terms based on the Intersection-over-Union (IoU) is a recent and promising trend for object detection. However, exploring such loss functions for oriented bounding boxes is a complex task since the IoU is not differentiable. In this work, we propose to represent object regions through probability density functions and define a similarity metric between two objects based on the Hellinger Distance that can be viewed as a Probabilistic IoU (ProbIoU). When Gaussian distributions are used (called Gaussian Bounding Boxes, or GBBs), the ProbIoU presents a differentiable closed-form expression that can be used as a localization loss for object detection. We present a simple mapping scheme from traditional bounding boxes to GBBs, allowing the proposed ProbIoU-based loss terms to be seamlessly integrated into any object detector. Finally, we show that GBBs can represent generic segmentation masks, and they induce a natural binary representation as elliptical regions (EGBBs) that adhere better to the segmentation masks than bounding boxes. Our experimental results show that the proposed localization loss term produces competitive results for object detection using bounding boxes and that EGBBs seem a better alternative for instance segmentation than bounding boxes.application/pdfengVisão computacionalDetecção de objetosComputer VisionObject DetectionSegmentationVision applicationsDeep LearningProbabilistic Intersection-over-Union for Training and Evaluation of Oriented Object DetectorsInterseção sobre união probabilística para treinamento e avaliação de detectores de objetos orientados info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001154386.pdf.txt001154386.pdf.txtExtracted Texttext/plain137553http://www.lume.ufrgs.br/bitstream/10183/252151/2/001154386.pdf.txte6170b8f973b0393401472ff6bedd67bMD52ORIGINAL001154386.pdfTexto completo (inglês)application/pdf73465642http://www.lume.ufrgs.br/bitstream/10183/252151/1/001154386.pdf1385a98800b03b04593900da5d329bfaMD5110183/2521512023-02-08 06:02:34.679343oai:www.lume.ufrgs.br:10183/252151Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-02-08T08:02:34Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
dc.title.alternative.en.fl_str_mv Interseção sobre união probabilística para treinamento e avaliação de detectores de objetos orientados
title Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
spellingShingle Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
Llerena, Jeffri Erwin Murrugarra
Visão computacional
Detecção de objetos
Computer Vision
Object Detection
Segmentation
Vision applications
Deep Learning
title_short Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
title_full Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
title_fullStr Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
title_full_unstemmed Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
title_sort Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
author Llerena, Jeffri Erwin Murrugarra
author_facet Llerena, Jeffri Erwin Murrugarra
author_role author
dc.contributor.author.fl_str_mv Llerena, Jeffri Erwin Murrugarra
dc.contributor.advisor1.fl_str_mv Jung, Claudio Rosito
contributor_str_mv Jung, Claudio Rosito
dc.subject.por.fl_str_mv Visão computacional
Detecção de objetos
topic Visão computacional
Detecção de objetos
Computer Vision
Object Detection
Segmentation
Vision applications
Deep Learning
dc.subject.eng.fl_str_mv Computer Vision
Object Detection
Segmentation
Vision applications
Deep Learning
description O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-12-01T04:53:42Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/252151
dc.identifier.nrb.pt_BR.fl_str_mv 001154386
url http://hdl.handle.net/10183/252151
identifier_str_mv 001154386
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/252151/2/001154386.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/252151/1/001154386.pdf
bitstream.checksum.fl_str_mv e6170b8f973b0393401472ff6bedd67b
1385a98800b03b04593900da5d329bfa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085603359850496