Deformable DETR (ICLR2021)

Pre-Trained Image Processing Transformer

paper：https://arxiv.org/abs/2010.04159

code：https://github.com/fundamentalvision/Deformable-DETR

基于洗漱空间采样的注意力机制：利用Deformable convolution（将固定形状的卷积过程改造成了能适应物体形状的可变的卷积过程，从而使结构适应物体形变的能力更强）对感受野上的每一个点加一个偏移量，偏移的大小是通过学习得来的，偏移后感受野不再是个正方形，而是和物体的实际形状相匹配。这么做的好处就是无论物体怎么形变，卷积的区域始终覆盖在物体形状的周围。

这篇论文提出了一个可变形注意力模块用来代替传统transformer中的attention module，只关注特征中的一部分关键位置。

Step1: 利用CNN获取多尺度特征（针对不同特征层的特征点可能拥有相同的位置编码，就无法区分他们，为了解决这个问题，增加一个'scale-level embedding'，它是可学习的，仅用于区分不同的特征层，也就是同一特征层中的所有特征点会对应相同的scale-level embedding。可以这么理解，每个班级都有个叫小明的同学，如果只看姓名的话，就无法区分，现在加上了班级就可以明确区分了）

Step2: 变形注意力机制与传统self-attention的区别是query不是和全局每个位置的key都计算注意力权重，而是对于每个query，仅在全局位置中采样部分位置的key，并且value也是基于这些位置进行采样插值得到的，最后将这个局部&稀疏的注意力权重施加在对应的value上。

Step3: Decorder部分与Transformer中主要的区别在于使用可变形注意力替代了原生的交叉注意力。类似地，每层的解码过程是self-attention+cross-attention+ffn，下一层输入的object query是上一层输出的解码特征

提出的两点提升性能的策略：1. Iterative Bounding Box Refinement 使用bbox检测头部对解码特征进行预测，得到相对于参考点(boxes or points)的偏移量，然后加上参考点坐标（先经过反sigmoid处理，即先从归一化的空间从还原出来），最后这个结果再经过sigmoid（归一化）得到校正的参考点，供下一层使用

2.two-stages 在原始 DETR 中，decoder中的目标查询与当前图像无关。受两阶段目标检测器的启发，用于生成区域建议（region proposals）作为第一阶段。生成的区域提议将作为目标查询输入decoder进行进一步细化，形成两阶段可变形 DETR。

Deformable DETR (ICLR2021)的更多相关文章

Deformable 可变形的DETR
Deformable 可变形的DETR This repository is an official implementation of the paper Deformable DETR: Defo ...
基于COCO数据集验证的目标检测算法天梯排行榜
基于COCO数据集验证的目标检测算法天梯排行榜 AP50 Rank Model box AP AP50 Paper Code Result Year Tags 1 SwinV2-G (HTC++) 6 ...
【DPM】Deformable Part Models matlab代码在windows下的调试过程
我下载的是voc-release5 1.按照这篇文章,都操作了一遍:http://blog.csdn.net/pozen/article/details/7023742#quote 2.运行demo不 ...
DPM(Deformable Parts Model)--原理(一)（转载）
DPM(Deformable Parts Model) Reference: Object detection with discriminatively trained partbased mode ...
关于DPM(Deformable Part Model)算法中模型结构的解释
关于可变部件模型的描写叙述在作者[2010 PAMI]Object Detection with Discriminatively Trained Part Based Models的论文中已经有说明 ...
(2) 用DPM(Deformable Part Model，voc-release4.01)算法在INRIA数据集上训练自己的人体检測模型
步骤一,首先要使voc-release4.01目标检測部分的代码在windows系统下跑起来: 參考在window下执行DPM(deformable part models) -(检測demo部分) ...
使用DPM(Deformable Part Model，voc-release3.1)算法INRIA通过训练你的身体检测模型数据集
我的环境 DPM源代码版本号:voc-release3.1 VOC开发包版本号:VOC2007_devkit_08-Jun Matlab版本号:MatlabR2012b c++编译器:VS2010 系 ...
Deformable Convolutional Network
Deformable conv赋予了CNN位置变换的能力,与普通卷积的对比如下.可以看到,在每个特征点上,会产生一个偏移,变成不规则的卷积(感觉本质上,就是让CNN自己去学习感受野). 思想来源于S ...
论文阅读笔记四十：Deformable ConvNets v2: More Deformable, Better Results（CVPR2018）
论文源址:https://arxiv.org/abs/1811.11168 摘要可变形卷积的一个亮点是对于不同几何变化的物体具有适应性.但也存在一些问题,虽然相比传统的卷积网络,其神经网络的空间形状 ...
论文阅读笔记三十八：Deformable Convolutional Networks（ECCV2017）
论文源址:https://arxiv.org/abs/1703.06211 开源项目:https://github.com/msracver/Deformable-ConvNets 摘要卷积神经网络 ...

随机推荐

rt_raster_to_gdal: Could not load the output GDAL driver
问题记录:postgis 安装后不能执行以下语句,查询入库的 tif 文件 SELECT ST_AsGDALRaster(rast, 'GTiff') As rastjpg FROM radar_da ...
shell - scriptreplay timing.log output.session
script -t 2> timing.log -a output.session cmd cmd cmd exit scriptreplay timing.log output.session ...
Android MD5加密、RSA加密
现在公司做金融项目,需要考虑安全加密方面的问题.感谢大牛同事(冯哥) ,给我很大的帮助. 考虑到安全优化,我们把秘钥.加密步骤放到native中.考虑用到的技术:(1 )jni,(2 )OpenSSL ...
SED fitting
Using the Robitaille (2017) YSO SED models https://notebook.community/hyperion-rt/paper-2017-sed-mod ...
crontab计划运行shell脚本，调用ncl执行失败
编写了bash脚本,调用ncl脚本绘图,在前台运行时候无误,但是加入crontab任务就是始终无法出图,并且无错误输出. 经过搜索,问题得到解决.是环境变量的问题.所有执行的命令,和文件都要指定完整的 ...
Centos7 更换yum软件源
https://blog.csdn.net/zhinian1204/article/details/123975403
接口设置ip跨域
// 允许跨域请求的地址'allowUrls' => [ 'http://localhost:8080', 'http://192.168.2.224', 'http://192.168.2.2 ...
Source Tree 1、解决打开闪退问题2、解决找不到项目的问题
闪退问题主要做了两点 1.版本降到3.1.2 下载链接:Sourcetree Download Archives | Sourcetree 2.参考博客做出文件修改参考bigbig猿博客新建json ...
访问不了github解决方案
1.首先通过网址https://github.com.ipaddress.com/www.github.com查看当前github.com对应的IP地址,查到的信息如下图所示修改hosts文件,wi ...
递归分批次插入数据（An I/O error occurred while sending to the backend报错解决方案）
//递归插入public void add(List<Object> all, long start, long limit){ //截取 List<Object> colle ...

Deformable DETR (ICLR2021)

Pre-Trained Image Processing Transformer

Deformable DETR (ICLR2021)的更多相关文章

随机推荐

热门专题