Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/252151 |
Resumo: | O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras. |
id |
URGS_768ad4fe920739ca34dc5711f2bd940c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/252151 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Llerena, Jeffri Erwin MurrugarraJung, Claudio Rosito2022-12-01T04:53:42Z2022http://hdl.handle.net/10183/252151001154386O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras.Using localization loss terms based on the Intersection-over-Union (IoU) is a recent and promising trend for object detection. However, exploring such loss functions for oriented bounding boxes is a complex task since the IoU is not differentiable. In this work, we propose to represent object regions through probability density functions and define a similarity metric between two objects based on the Hellinger Distance that can be viewed as a Probabilistic IoU (ProbIoU). When Gaussian distributions are used (called Gaussian Bounding Boxes, or GBBs), the ProbIoU presents a differentiable closed-form expression that can be used as a localization loss for object detection. We present a simple mapping scheme from traditional bounding boxes to GBBs, allowing the proposed ProbIoU-based loss terms to be seamlessly integrated into any object detector. Finally, we show that GBBs can represent generic segmentation masks, and they induce a natural binary representation as elliptical regions (EGBBs) that adhere better to the segmentation masks than bounding boxes. Our experimental results show that the proposed localization loss term produces competitive results for object detection using bounding boxes and that EGBBs seem a better alternative for instance segmentation than bounding boxes.application/pdfengVisão computacionalDetecção de objetosComputer VisionObject DetectionSegmentationVision applicationsDeep LearningProbabilistic Intersection-over-Union for Training and Evaluation of Oriented Object DetectorsInterseção sobre união probabilística para treinamento e avaliação de detectores de objetos orientados info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001154386.pdf.txt001154386.pdf.txtExtracted Texttext/plain137553http://www.lume.ufrgs.br/bitstream/10183/252151/2/001154386.pdf.txte6170b8f973b0393401472ff6bedd67bMD52ORIGINAL001154386.pdfTexto completo (inglês)application/pdf73465642http://www.lume.ufrgs.br/bitstream/10183/252151/1/001154386.pdf1385a98800b03b04593900da5d329bfaMD5110183/2521512023-02-08 06:02:34.679343oai:www.lume.ufrgs.br:10183/252151Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-02-08T08:02:34Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
dc.title.alternative.en.fl_str_mv |
Interseção sobre união probabilística para treinamento e avaliação de detectores de objetos orientados |
title |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
spellingShingle |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors Llerena, Jeffri Erwin Murrugarra Visão computacional Detecção de objetos Computer Vision Object Detection Segmentation Vision applications Deep Learning |
title_short |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
title_full |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
title_fullStr |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
title_full_unstemmed |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
title_sort |
Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors |
author |
Llerena, Jeffri Erwin Murrugarra |
author_facet |
Llerena, Jeffri Erwin Murrugarra |
author_role |
author |
dc.contributor.author.fl_str_mv |
Llerena, Jeffri Erwin Murrugarra |
dc.contributor.advisor1.fl_str_mv |
Jung, Claudio Rosito |
contributor_str_mv |
Jung, Claudio Rosito |
dc.subject.por.fl_str_mv |
Visão computacional Detecção de objetos |
topic |
Visão computacional Detecção de objetos Computer Vision Object Detection Segmentation Vision applications Deep Learning |
dc.subject.eng.fl_str_mv |
Computer Vision Object Detection Segmentation Vision applications Deep Learning |
description |
O uso de termos de perda de localização baseados no Intersection-over-Union (IoU) é uma tendência recente e promissora para detecção de objetos. No entanto, explorar tais funções de perda para caixas delimitadoras orientadas é uma tarefa desafiadora, pois a IoU não é diferenciável. Neste trabalho, propomos representar regiões de objetos através de funções de densidade de probabilidade e definir uma métrica de similaridade entre dois objetos baseada na Distância de Hellinger que pode ser vista como uma IoU Probabilística (ProbIoU). Quando são usadas distribuições gaussianas (chamadas Gaussian Bounding Boxes, ou GBBs), o ProbIoU apresenta uma expressão de forma fechada diferenciável que pode ser usada como perda de localização para detecção de objetos. Apresentamos um esquema de mapeamento simples de caixas delimitadoras tradicionais para GBBs, permitindo que os termos de perda baseados em ProbIoU propostos sejam perfeitamente integrados a qualquer detector de objetos. Finalmente, mostramos que GBBs podem representar máscaras de segmentação genéricas e induzem uma representação binária natural como regiões elípticas (EGBBs) que aderem melhor às máscaras de segmentação do que caixas delimitadoras. Nossos resultados experimentais mostram que o termo de perda de localização proposto produz resultados competitivos para detecção de objetos usando caixas delimitadoras, e que EGBBs parecem uma alternativa melhor para segmentação de instâncias do que caixas delimitadoras. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-12-01T04:53:42Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/252151 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001154386 |
url |
http://hdl.handle.net/10183/252151 |
identifier_str_mv |
001154386 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/252151/2/001154386.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/252151/1/001154386.pdf |
bitstream.checksum.fl_str_mv |
e6170b8f973b0393401472ff6bedd67b 1385a98800b03b04593900da5d329bfa |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085603359850496 |