论文提出从IoU指标延伸来的PIoU损失函数，能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果，对anchor-based方法和anchor-free方法均适用。另外论文提供了Retail50K数据集，能够很好地用于评估倾斜目标检测算法的性能

来源：晓飞的算法工程笔记公众号

论文: PIoU Loss: Towards Accurate Oriented Object Detection in Complex Environments

Introduction

当前的目标检测方法由于BB(bounding boxes)的特性，对倾斜和密集物体的检测存在一定的局限性。为了解决这个问题，研究者扩展出了带旋转参数的OBB(oriented bounding boxes)，即从BB($c_x,c_y,w,h$)扩展为OBB($c_x,c_y,w,h,\theta$)，其中$\theta$旋转角度，这样OBB就能更紧凑地包围目标，可以更好地检测旋转和密集的物体。

目前的OBB-based方法大多数在anchor-based架构上采用距离损失来优化上述的5个参数，并且在航空图片的目标检测上已经有一些应用。但其检测性能在更复杂的场景中依然存在局限性，主要原因在于距离损失更多地是优化旋转角度误差，而不是优化全局IoU，特别是对长条形物体很不敏感。如图a所示，两个IoU相差很大的情景下，距离损失的结果却是一样的。

为了解决这个问题，论文提出PIoU(Pixels-IOU)损失来同时提高旋转角度和IoU的准确率。如图b所示，PIoU损失能直接反映物体间的IoU，但由于OBB间的相交区域可能是多边形，OBB的IoU比BB的IoU要难算得多，所以PIoU损失以逐像素判断的方式进行IoU计算并且是连续可微的。另外论文还提供了包含高长宽比倾斜目标的检测数据集Retail50K，方便OBB-based检测算法的研究。

论文的贡献如下：

提出新的损失函数PIoU损失，能够提升倾斜目标的检测效果。
提供新的数据集Retail50K，可以更好的进行OBB-based算法的评估。
通过实验证明PIoU损失的有效性，能够运用于anchor-based和anchor-free方法。

Pixels-IoU (PIoU) Loss

对于OBB $b$($c_x, c_y, w,h,\theta$)，理想的损失函数能够引导网络最大化IoU，降低$b$的错误率。为了到达这个目的，需要准确且高效地计算OBB间的IoU，论文采用了像素计数的方式来计算IoU。

对于点$p_{ij}$和OBB $b$，根据其到中线的距离$d^{h_{i,j}$和中线交点到中点的距离$d}w_{i,j}$来判断点是否在OBB内：

定义$B_{b,b^{{'}}$为包围$b$和$b}{'}$的最小正方形，可以通过判断$B_{b,b^{{'}}$中的所有像素来计算$b$和$b}{'}$间的交集区域和并集区域：

最后通过$S_{b\cap b^{'}}$除以$S_{b\cup b^{'}}$计算IoU，但公式1并不是连续可微函数，导致不能进行反向传播训练。为了解决这个问题，将公式1转换为两个核的乘积$F(p_{i,j}|b)$：

其中$k$用于控制对目标像素$p_{i,j}$的敏感程度，由于公式9使用了相对位置信息(图a的点距离和三角形的角度)，所以$S_{b\cap b^{'}}$和$S_{b\cup b^{'}}$均是对OBB的旋转角度和大小敏感的。

如图b所示，$F(p_{i,j}|b)$是连续可微的，且与公式1类似。当$p_{i,j}$在$b$内时，$F(p_{i,j}|b)$接近于1，反之则接近于0。为此，$b$和$b^{'}$的交并集区域计算变为：

为了降低公式11的计算量，简化为：

基于公式10和公式12，PIoU的计算为：

定义$M$为所有正样本对，PIoU损失的计算为：

PIoU损失也可用于无交集的OBB，因为PIoU始终大于零，梯度依然可以计算，另外PIoU损失也可以用于正常的BB场景中。

Retail50K Dataset

之前的大多数OBB数据集都是航空图片，少部分数据集对MSCOCO等数据集进行重新标注。据统计，航空图片数据集中大多数OBB的长宽比都在1:4内，而主流数据集则集中在1:1，不能够很好地评价OBB-based方法的性能。为此，论文提供了Retail50K数据集，由47000张不同的超市图片构成，标注对象为货架的层架边。数据集包含复杂的背景和高长宽比目标，并且具有实际使用意义。

Experiments

不同$k$下对比实验。

对比其它损失函数在OBB场景下的性能。

对比其它损失函数在BB场景下的性能。

Retail50K数据集上的性能对比。

HRSC2016数据上的性能对比。

DOTA数据上的性能对比。

结果可视化对比。

Conclustion

论文提出从IoU指标延伸来的PIoU损失函数，能够有效地提高倾斜目标检测场景下的旋转角度预测和IoU效果，对anchor-based方法和anchor-free方法均适用。从结果来看，PIoU损失的效果还是十分明显的。另外论文提供了Retail50K数据集，能够很好地用于评估倾斜目标检测算法的性能。

如果本文对你有帮助，麻烦点个赞或在看呗～

更多内容请关注微信公众号【晓飞的算法工程笔记】

PIoU Loss：倾斜目标检测专用损失函数，公开超难倾斜目标数据集Retail50K | ECCV 2020 Spotlight的更多相关文章

腾讯推出超强少样本目标检测算法，公开千类少样本检测训练集FSOD | CVPR 2020
论文提出了新的少样本目标检测算法,创新点包括Attention-RPN.多关系检测器以及对比训练策略,另外还构建了包含1000类的少样本检测数据集FSOD,在FSOD上训练得到的论文模型能够直接迁移到 ...
【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作！
文章目录 1 目标检测简介 2 lmdb数据制作 2.1 VOC数据制作 2.2 lmdb文件生成 lmdb格式的数据是在使用caffe进行目标检测或分类时,使用的一种数据格式.这里我主要以目标检测为 ...
【目标检测】用Fast R-CNN训练自己的数据集超详细全过程
目录: 一.环境准备二.训练步骤三.测试过程四.计算mAP 寒假在家下载了Fast R-CNN的源码进行学习,于是使用自己的数据集对这个算法进行实验,下面介绍训练的全过程. 一.环境准备我这里 ...
[炼丹术]YOLOv5目标检测学习总结
Yolov5目标检测训练模型学习总结一.YOLOv5介绍 YOLOv5是一系列在 COCO 数据集上预训练的对象检测架构和模型,代表Ultralytics 对未来视觉 AI 方法的开源研究,结合了在 ...
[目标检测]YOLO原理
1 YOLO 创新点: 端到端训练及推断 + 改革区域建议框式目标检测框架 + 实时目标检测 1.1 创新点 (1) 改革了区域建议框式检测框架: RCNN系列均需要生成建议框,在建议框上进行分类与回 ...
第三十六节，目标检测之yolo源码解析
在一个月前,我就已经介绍了yolo目标检测的原理,后来也把tensorflow实现代码仔细看了一遍.但是由于这个暑假事情比较大,就一直搁浅了下来,趁今天有时间,就把源码解析一下.关于yolo目标检测的 ...
目标检测算法之YOLOv1与v2
YOLO:You Only Look Once(只需看一眼) 基于深度学习方法的一个特点就是实现端到端的检测,相对于其他目标检测与识别方法(如Fast R-CNN)将目标识别任务分成目标区域预测和类别 ...
Domain Adaptive Faster R-CNN：经典域自适应目标检测算法，解决现实中痛点，代码开源 | CVPR2018
论文从理论的角度出发,对目标检测的域自适应问题进行了深入的研究,基于H-divergence的对抗训练提出了DA Faster R-CNN,从图片级和实例级两种角度进行域对齐,并且加入一致性正则化来学 ...
CVPR目标检测与实例分割算法解析：FCOS（2019），Mask R-CNN（2019），PolarMask（2020）
CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)1. 目标检测:FCOS(CVPR 2019)目标检测算法FCOS(FCOS: ...

随机推荐

image classification backbone 汇总分析
下面是一个list,可以详细看一下 image_classification = [['name','top1_acc','top5_acc','size'],['FixEfficientNet-L2 ...
用Unity3D实现太阳系仿真
用Unity3D模拟太阳系仿真模拟要求写一个程序,实现一个完整的太阳系, 其他星球围绕太阳的转速必须不一样,且不在一个法平面上. 操作步骤 1.创建如下结构 sun 里包括8大行星, 并且设置好距 ...
漏洞重温之XSS（中）
漏洞重温之XSS(中) XSS挑战之旅 level8-level13 level8 第八关开局,发现button从搜索变成了友情链接,发现该页面情况跟前面不同,先右键查看代码,再进行尝试. 上测试代码 ...
谈谈对volatile关键字的理解
1. volatile的特性 volatile是Java语言提供的一种轻量级的同步机制,用来确保将变量得更新操作通知到其它线程.具备三种特性: 保证变量的可见性: 对于volatile修饰的变量进行单 ...
python 10 else EasyGui(转载）
else语句 if else 要么怎么样,要么不怎么样 while else 干完了能怎样,干不完就不怎样 (异常处理) else 没有问题,就干吧 try: int('a') except Valu ...
VScode+PicGo+Github+jsdelivr使用图床书写Markdown
本文讲述使用Github作为图床,VScode搭配Picgo插件书写Markdown,并使用jsdelivr进行CDN加速的配置流程. 准备阶段首先进行以下准备工作,都很简单,不再赘述. 注册Git ...
JavaScript学习系列博客_17_JavaScript中的函数的参数、返回值
数的形参(形式参数) - 定义函数时,可以在()中定义一个或多个形参,形参之间使用英文逗号隔开:定义形参就相当于在函数内声明了对应的变量但是并不赋值,形参会在调用时才赋值. 函数的实参(实际参数) - ...
JavaScript学习系列博客_4_JavaScript中的数据类型
JavaScript中有6种数据类型一.基本数据类型 - String 字符串 JS中的字符串需要使用引号引起来双引号或单引号都行但是要注意的是某种引号嵌套使用的话,需要加上 \ 转义.比如说我们 ...
正则表达式截取xml
$str = '<Ips><GateWayRsp><head><ReferenceID>123</ReferenceID><RspCo ...
MySQL数据库中查询数据库表、字段总数量，查询数据总量
最近要查询一些数据库的基本情况,由于以前用oracle数据库比较多,现在换了MySQL数据库,就整理了一部分语句记录下来. 1.查询数据库表数量 #查询MySQL服务中数据库表数据量 SELECT C ...

PIoU Loss：倾斜目标检测专用损失函数，公开超难倾斜目标数据集Retail50K | ECCV 2020 Spotlight