边界对于定位问题十分重要，BorderDet的核心思想BorderAlign巧妙又有效，将边界特征融入到目标定位预测中，而且能够简单地融入到各种目标检测算法中带来较大的性能提升下。在开源实现中，对BorderAlign进行了高效CUDA实现，不会对耗时带来很大的影响，整个工作十分扎实

来源：晓飞的算法工程笔记公众号

论文: BorderDet: Border Feature for Dense Object Detection

论文地址：https://arxiv.org/abs/2007.11056
论文代码：https://github.com/Megvii-BaseDetection/BorderDet

Introduction

目前大部分的point-based目标检测算法(SSD, RetinaNet, FCOS)使用特征图的single-point进行定位和分类，但single-point特征可能没有足够多的信息来表达完整的实例以及实例的边界信息。很多研究通过各种手段补充single-point的特征表达能力，这些方法虽然能够提取更多的特征，但可能带来不必要的计算以及会受背景的影响。最关键的，这些方法都没有直接利用边界特征，而边界对于定位是十分重要的。为此，论文提出新的特征提取操作BorderAlign，可直接利用边界特征优化原本的single-point特征，基于BorderAlign提出了SOTA目标检测算法BorderDet。

论文的主要贡献如下：

分析dense object detector的特征表达，展示边界特征对补强single-point特征的重要性。
提出新的特征提取操作BorderAlign，通过边界特征来优化网络特征，并基于BorderAlign提出高性能目标检测算法BorderDet。
在COCO数据集上，将BAM模块集成到FCOS和FPN中分别提升2.8AP和3.6AP，而集成到ResNext-101-DCN准确率为50.3AP，达到SOTA。

Our Approach

Motivation

论文以FCOS为baseline，加入第二阶段预测来对比多种特征增强方法的效果，最后发现仅用边界中心点的增强效果与region-based方法几乎一样。从实验结果来看，可以得出以下结论：

point-based特征表达缺乏完整物体的显著特征，需要进行特征增强。
从完整的boxes内提取特征是不必要的，且存在冗余。
高效的边界特征提取策略能够带来更好的性能。

Border Align

密集地从边界提取特征是很低效的，一般边界上的目标物体相关的点很少，大多为背景点。为此，论文提出BorderAlign特征提取操作，能够有效且自适应地榨取边界特征。

参考R-FCN的思想，BorderAlign提取\((4+1)C\)维度的border-sensitive特征图作为输入，\(4C\)维度对应4条边，另外\(C\)维对应原本的single-point特征。假定特征图顺序为(single point, left border, top border, right border和bottom border)，计算输出特征图时，对点\((i, j)\)对应的bbox的每条边均匀取\(N\)个采样点，\(N\)默认设为10，采样点的值使用双线性插值计算，最后通过channel-wise max-pooling得到输出：

\((x_0, y_0, x_1, y_1)\)为点\((i,j)\)预测的bbox，这种方法能够自适应地从边界极点榨取边界特征。

论文对border-sensitive特征图中各channel的最大值进行了可视化，发现最大值分布基本符合预设的作用。

Border Alignment Module

BAM模块封装了BorderAlign操作，先使用\(1\times 1\)卷积生成border-sensitive feature maps，然后结合初步bbox预测，通过BorderAlign输出Border增强后的特征图，再使用\(1\times 1\)卷积恢复为模块输入维度。

BorderDet

BorderDet基于FCOS检测架构，主要在特征金字塔的预测head中加入BAM模块。首先预测初步bbox预测和初步分类预测，然后将初步bbox预测输入到BAM模块得到Border分类预测和Border bbox预测，预测跟原先一样使用\(1\times 1\)卷积，最后统一两种结果进行输出。

BorderRPN

BAM模块也能用于two-stage目标检测算法中，将原本第二阶段的region-based特征提取改为文中的BAM模块进行边界特征增强预测，另外将前面特征提取的卷积改为空洞卷积来提升感受域。

Model Training and Inference

Target Assignment

BorderDet基于FCOS进行初步预测，在第二阶段将GT赋予每个IoU大于0.6的初步预测结果，回归目标定义为：

\(\sigma\)为方差，用于提高多任务学习的效率，默认为0.5。

Loss Function

BorderDet的损失函数定义为：

\(\mathcal{L}^C_{cls}\)和\(\mathcal{L}^C_{reg}\)为初步分类损失和初步定位损失，在实现时分别为focal loss和IoU loss，\(\mathcal{L}^B_{cls}\)和\(\mathcal{L}^B_{reg}\)则计算border预测结果与对应GT之间的分类损失和定位损失，仅处理正样本，在实现时分别为focal loss和\(\mathcal{L}_1\) loss。

Inference

BorderDet在推理时对两种分类结果进行直接的相乘输出，而对于定位则使用border定位预测对初步定位的bbox进行公式2的反向转换，对所有的结果进行NMS输出，IoU阈值为0.6。

Experiments

对BAM模块以及BorderAlign参数进行对比实验。

对比其它特征增强方法，作者对BorderAlign进行高效的CUDA实现，速度很快。

直接将BorderDet结合到one-stage检测器和two-stage检测器中。

与主流的检测算法进行对比。

Conclustion

边界对于定位问题十分重要，BorderDet的核心思想BorderAlign巧妙又有效，将边界特征融入到目标定位预测中，而且能够简单地融入到各种目标检测算法中带来较大的性能提升下。在开源实现中，对BorderAlign进行了高效CUDA实现，不会对耗时带来很大的影响，整个工作十分扎实。

如果本文对你有帮助，麻烦点个赞或在看呗～

更多内容请关注微信公众号【晓飞的算法工程笔记】

BorderDet：通过边界特征大幅提升检测准确率，即插即用且速度不慢 | ECCV 2020 Oral的更多相关文章

SIFT特征点检测学习一（转载）
新手上路,先转载学习tornadomeet的博客:http://www.cnblogs.com/tornadomeet/archive/2012/08/16/2643168.html 特征点检测学习_ ...
[DeeplearningAI笔记]卷积神经网络3.1-3.5目标定位/特征点检测/目标检测/滑动窗口的卷积神经网络实现/YOLO算法
4.3目标检测觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.1目标定位对象定位localization和目标检测detection 判断图像中的对象是不是汽车--Image clas ...
OpenCV计算机视觉学习（13）——图像特征点检测（Harris角点检测，sift算法）
如果需要处理的原图及代码,请移步小编的GitHub地址传送门:请点击我如果点击有误:https://github.com/LeBron-Jian/ComputerVisionPractice 前言 ...
OpenCV特征点检测------ORB特征
OpenCV特征点检测------ORB特征 ORB是是ORiented Brief的简称.ORB的描述在下面文章中: Ethan Rublee and Vincent Rabaud and Kurt ...
ORB特征点检测
Oriented FAST and Rotated BRIEF www.cnblogs.com/ronny 这篇文章我们将介绍一种新的具有局部不变性的特征 -- ORB特征,从它的名字中可以看出它 ...
OPENCV图像特征点检测与FAST检测算法
前面描述角点检测的时候说到,角点其实也是一种图像特征点,对于一张图像来说,特征点分为三种形式包括边缘,焦点和斑点,在OPENCV中,加上角点检测,总共提供了以下的图像特征点检测方法 FAST SURF ...
python+OpenCV 特征点检测
1.Harris角点检测 Harris角点检测算法是一个极为简单的角点检测算法,该算法在1988年就被发明了,算法的主要思想是如果像素周围显示存在多于一个方向的边,我们认为该点为兴趣点.基本原理是根据 ...
OpenCV特征点检测匹配图像-----添加包围盒
最终效果: 其实这个小功能非常有用,甚至加上只有给人感觉好像人脸检测,目标检测直接成了demo了,主要代码如下: // localize the object std::vector<Point ...
OpenCV特征点检测------Surf（特征点篇）
Surf(Speed Up Robust Feature) Surf算法的原理 ...
surf特征点检测
※注:参数SURF中的hessian阈值是图像Hessian矩阵判别式的阈值,值越大检测出的特征点就越少,也就意味着特征点越稳定 #include "opencv2/core/core.hp ...

随机推荐

JavaFX的目录结构, 项目创建和发布, 基于JDK11+JavaFX SDK17
JDK 和 JavaFX SDK 需要使用JDK11, 推荐使用 https://adoptium.net/releases.html JDK11 JavaFX 11 不再是JDK的一部分, 需要单独 ...
使用BP神经网络实现函数逼近
1 一元函数逼近 1.1 待逼近函数 1.2 代码 clear,clc p=[-4:0.1:4]; %神经网络输入值 t=sin(0.5*pi*p)+sin(pi*p); %神经网络目标值 n=15; ...
spring boot和redis实现自定义前后分离token认证
说明:文章部分代码引用自github 本项目地址:https://gitee.com/indexman/redis-token-demo 1.token认证流程此处以前端页面请求后端用户列表接口为例 ...
掌握云容器网络：何为ipvs
本文分享自华为云社区<[理解云容器网络]2-基础篇-ipvs介绍>,作者: 可以交个朋友. IPVS简介 ipvs是工作在Linux内核态的4层负载均衡:和用户态的负载均衡软件(如ngin ...
nosql几种热门数据库的优缺点及应用场景
MongoDB.ElasticSearch.Redis.HBase这四种热门数据库的优缺点及应用场景 https://www.cnblogs.com/chong-zuo3322/p/12869059. ...
centos7安装桌面-GNOME
CENTOS7安装桌面系统 GNOME桌面 # yum安装 # 更新已安装软件 yum upgrade -y # 安装额外yum源 yum install epel-release -y # 安装X ...
【LeetCode数组#1二分法】二分查找、搜索插入、在排序数组中查找元素的第一个和最后一个位置
二分查找题目力扣704题目链接给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 ...
Windows开发环境如何启用Directory.Build.props版本号集中管理
每个产品一个根目录 Directory.Build.props的工作模式和NuGet.Config不同,Directory.Build.props不能继承.当dotnet restore工作的时候,会 ...
浅入 ABP系列(3)：增加日志组件、依赖注入服务
目录自动依赖注入添加日志依赖添加日志功能依赖注入版权护体作者:痴者工良,微信公众号转载文章需要 <NCC开源社区>同意. 前面两篇我们搭建了一个基础的.简单的,具有统一响应格式的 ...
nginx 基本功能
1.nginx简介官方文档 Nginx是一个高性能WEB服务器,除它之外Apache.Tomcat.Jetty.IIS,它们都是Web服务器,或者叫做WWW(World Wide Web)服务器,相 ...

BorderDet：通过边界特征大幅提升检测准确率，即插即用且速度不慢 | ECCV 2020 Oral