题目：Deep Continuous Fusion for Multi-Sensor 3D Object Detection

来自：Uber: Ming Liang

Note: 没有代码，主要看思想吧，毕竟是第一篇使用RGB feature maps 融合到BEV特征中；

从以下几个方面开始简述论文

Open Problems
Contributions
Methods
Experiments
My Conclusion

1> Open Problems

联合多传感器数据能获得更好的特征表示；
数据融合问题: 现有方法是将雷达特征投影到图像特征中，当做一个深度通道来处理，这种方法的局限是需要两步来完成；
雷达获取稀疏的特征，相机获取稠密的特征，如何将稠密的图像特征投影到稀疏的雷达特征图中；

2>Contributions

首个将图像特征投影到BEV（雷达鸟瞰图）中，构建一个基于雷达的目标检测器；
提出Continuous Fusion Layer 用于将多尺度的图像特征融合到雷达特征中；
当时具有较高的检测精度和较高的执行效率；

3>Methods

看图说话：

简述流程

camera图像和雷达俯视图分别用ResNet提取不通尺度特征的，将camera图像提取的多尺度特征进行融合，经过本文设计的“连续融合层”以融合到BEV的不通尺度的特征中，学到的特征经个两个固定尺度的anchor，每个尺度两个方向（0,90°）NMS获取最终的3D目标检测。

为什么要先融合图像的多尺度特征再融合到不通尺度的BEV特征图中去？

这样做能相当于一个交叉融合，每个送往BEV特征都来自于三个不同尺度的特征，而不像是直接对应尺度融合仅仅来自于单一尺度的图像特征图；

连续融合层

深度连续卷积

连续卷积融合层相当于连续卷积，和传统卷积的差异如下：

训练损失

损失包含两个方面，分别损失和回归损失，和2D目标检测一样，只是boundbox多了个目标的高度和方向，看公式吧，不在赘述；

4>Experiments

数据集说明

Compare with other state-of-the-art methods

Ablation Study on KITTI

TOR4D BEV Object Detection

5>My Conclusion

方法角度来看：本文是个很好的思路：通过变换LIDAR数据的不通方向上的投影，来融合多源的数据；
实验角度来看：能被检测的目标类别还很少；TOR4D上的精读还比较差，所以具备发挥的空间；

三维目标检测论文阅读：Deep Continuous Fusion for Multi-Sensor 3D Object Detection的更多相关文章

目标检测论文阅读：Deformable Convolutional Networks
https://blog.csdn.net/qq_21949357/article/details/80538255 这篇论文其实读起来还是比较难懂的,主要是细节部分很需要推敲,尤其是deformab ...
论文阅读笔记五十七:FCOS: Fully Convolutional One-Stage Object Detection(CVPR2019)
论文原址:https://arxiv.org/abs/1904.01355 github: tinyurl.com/FCOSv1 摘要本文提出了一个基于全卷积的单阶段检测网络,类似于语义分割,针对每 ...
论文阅读 | RefineDet：Single-Shot Refinement Neural Network for Object Detection
论文链接:https://arxiv.org/abs/1711.06897 代码链接:https://github.com/sfzhang15/RefineDet 摘要 RefineDet是CVPR ...
论文阅读笔记六十三：DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling（CVPR2017）
论文原址:https://arxiv.org/abs/1703.10295 github:https://github.com/lachlants/denet 摘要本文重新定义了目标检测,将其定义为 ...
【CV论文阅读】：Rich feature hierarchies for accurate object detection and semantic segmentation
R-CNN总结不总结就没有积累 R-CNN的全称是 Regions with CNN features.它的主要基础是经典的AlexNet,使用AlexNet来提取每个region特征,而不再是传统 ...
论文阅读：EGNet: Edge Guidance Network for Salient Object Detection
论文地址:http://openaccess.thecvf.com/content_ICCV_2019/papers/Zhao_EGNet_Edge_Guidance_Network_for_Sali ...
ICCV2019论文点评：3D Object Detect疏密度点云三维目标检测
ICCV2019论文点评:3D Object Detect疏密度点云三维目标检测 STD: Sparse-to-Dense 3D Object Detector for Point Cloud 论文链 ...
CVPR2020论文解读：3D Object Detection三维目标检测
CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...
转载:点云上实时三维目标检测的欧拉区域方案 ----Complex-YOLO
感觉是机器翻译,好多地方不通顺,凑合看看原文名称:Complex-YOLO: An Euler-Region-Proposal for Real-time 3D Object Detection ...

随机推荐

.NET Core3.0 日志 logging
多年的经验,日志记录是软件开发的重要组成部分.没有日志记录机制的系统不是完善的系统.在开发阶段可以通过debug附件进程进行交互调试,可以检测到一些问题,但是在上线之后,日志的记录起到至关重要的作用. ...
centos7将python默认版本升级
想用centos7来写python,但是默认安装的是python2.7(python -v命令可以查看版本信息) 准备升级到python3.5.2 首先安装编译环境 yum -y install gc ...
vscode发博客插件更新v0.1.0(可能会相对好用点吧)
距离上一次编写这个vscode在博客园发博客的插件已经过去好久了,那个时候vscode插件的功能也没有那么强大,期间有人提出问题来,也有人提出建议来,我一直没有抽出时间来维护,深感抱歉,直到有人加到我 ...
Java基础（43）Queue队列
Collection接口的第三个子接口是Queue接口,而Queue接口的子接口又是Deque接口和BlockingQueue接口. 实现了Deque接口的类有:ArrayDeque类.Concurr ...
python之ORM（对象关系映射）
实现了数据模型与数据库的解耦,通过简单的配置就可以轻松更换数据库,而不需要更改代码.orm操作本质上会根据对接的数据库引擎,翻译成对应的sql语句.所有使用Django开发的项目无需关心程序底层使用的 ...
在docker中创建使用MySQL，并实现远程连接navicat
在 docker 中使用 mysql 安装完docker之后,在命令行中输入docker images可以查看自己创建的image(安装下载docker的教程很多了,大家需要可以去查一下就可以了)这里 ...
C#３种常见的定时器（多线程）
总结以下三种方法,实现c#每隔一段时间执行代码: 方法一:调用线程执行方法,在方法中实现死循环,每个循环Sleep设定时间: 方法二:使用System.Timers.Timer类: 方法三:使用Sys ...
基于UGUI的框架
这个框架简单易懂,上手就可以直接拿来用,主要是单例管理类,界面和界面之间的互相交流通过单例去实现,个人感觉不是很好,但是我特别喜欢他的管理层级非常分明. 之后会发一个广播机制,结合上这套UI框架,但是 ...
activeMQ 安装及启动异常处理
一.环境: [root@centos_6 ~]# cat /etc/system-release CentOS release 6.5 (Final) [root@centos_6 ~]# uname ...
Mysql常用数据类型归纳总结1
一直在用Mysql数据库,Mysql的数据类型也最常打交道的.但关于Mysql的一些常用数据类型了解程度仅限于一知半解,仅仅能满足满足于平时一些最简单的操作.而Mysql常用数据类型的定义以及规范理解 ...

三维目标检测论文阅读：Deep Continuous Fusion for Multi-Sensor 3D Object Detection

题目：Deep Continuous Fusion for Multi-Sensor 3D Object Detection

来自：Uber: Ming Liang

Note: 没有代码，主要看思想吧，毕竟是第一篇使用RGB feature maps 融合到BEV特征中；

Open Problems

Contributions

Methods

Experiments

My Conclusion

1> Open Problems

2>Contributions

3>Methods

简述流程

连续融合层

深度连续卷积

训练损失

4>Experiments

数据集说明

​

Compare with other state-of-the-art methods

Ablation Study on KITTI

TOR4D BEV Object Detection

5>My Conclusion

三维目标检测论文阅读：Deep Continuous Fusion for Multi-Sensor 3D Object Detection的更多相关文章

随机推荐

热门专题