3D点云完美匹配

The Perfect Match: 3D Point Cloud Matching with Smoothed Densities

地址链接:

http://openaccess.thecvf.com/content_CVPR_2019/papers/Gojcic_The_Perfect_Match_3D_Point_Cloud_Matching_With_Smoothed_Densities_CVPR_2019_paper.pdf

代码链接:https://github.com/zgojcic/3DSmoothNet

摘要

提出三维平滑网,一个完整的工作流程来匹配三维点云与siamese深度学习架构和全卷积层使用体素化平滑密度值(SDV)表示。后者按兴趣点计算,并与局部参考坐标系(LRF)对齐,以实现旋转不变性。紧凑、学习、旋转不变的三维点云描述符在3DMatch基准数据集[49]上实现了94.9%的平均召回率,在仅32个输出维度的情况下,其性能超过最新水平20%以上。这种非常低的输出维度允许在标准PC上对每个特征点进行0.1毫秒的近实时对应搜索。SDV、LRF和学习具有完全卷积层的高描述性特征,本文用传感器和场景诊断。在建筑物的RGB-D室内场景上训练的3d smoothnet在室外植被的激光扫描上达到79.0%的平均召回率,比最近的、以学习为基础的竞争对手[49、17、5、4]的性能提高了一倍以上。

贡献

提出了一种新的用于三维点云匹配的紧凑学习局部特征描述子,该描述子计算效率高,性能显著优于现有的所有方法。

一个主要技术创新是平滑密度值(SDV)体素化,是一种新的输入数据表示方法,适用于标准深度学习库的完全卷积层。SDV的增益是两倍。一方面,它减少了稀疏性输入体素网格,在反向传播过程中有更好的梯度流动,同时减少边界效应,以及平滑由于局部参考帧(LRF)估计错误而导致的小的未对准。另一方面,模拟了深层网络通常在第一层学习的平滑,节省了学习高度描述性特征的网络容量。

其次,提出了一个具有完全卷积层的暹罗网络结构,学习一个非常紧凑的、旋转不变的3D局部特征描述。这种方法生成低维、高度描述性的特征,这些特征概括了不同的传感器模式以及从室内到室外的场景。

此外,证明了低维特征描述符(只有16或32个输出维)极大地加快了对应搜索的速度,从而允许实时应用。

工作流程如下(图2和3):

(i)给定两个原始点云。

(ii)计算随机选择的兴趣点周围球面邻域的LRF。

(iii)将邻域转换为其规范表示。

(i v)借助高斯平滑对其进行体素化。

(v)推断每个点的局部特征使用3DSmoothNet的描述符,例如,用作基于RANSAC的健壮点云注册管道的输入。

与手工制作的特征表示不同,SDV体素网格表示为输入提供了几何信息结构,能够利用卷积层来捕获点云的局部几何特征(图5)。

网络架构(图3)受到L2Net[36]的启发,L2Net是一个最先进的学习型局部图像描述符。3DSmoothNet由堆叠的卷积层组成,在一些卷积层中应用2步(而不是最大池)来向下采样输入[33]。除最后一层外,所有卷积层后面都是批量标准化[14]并使用ReLU激活函数[22]。

在3DMatch数据集的点云碎片上训练3dsmouthNet(图3)[49]。这是一个RGB-D数据集,由62个真实的室内场景组成,从办公室和酒店房间到桌面和卫生间。从数据集池[41、32、19、39、3]获得的点云被分成54个场景进行训练,8个场景进行测试。每一个场景被分割成若干部分重叠的片段,其地面真值转换参数为T。

表中总结了与3DMatch数据集的最新实验评估结果的比较。图4所示为1(左)和2个hard数据集。

一般目标是以最低的输出维度(即3dsmouthNet最后一个卷积层中的滤波器数目)实现最高的匹配性能,以减少运行时间并节省内存。首先进行测试,以找到3dsmouthNet描述符匹配性能和效率之间的一个很好的折衷方案。随着输出尺寸的增加,3dsmouthNet的性能很快开始饱和(图6)。当使用超过64个维度时,只有边际改进(如果有的话)。决定只对16维和32维的3DSmoothNet进行进一步的实验。

增大输入比τ2=0.2显著减少RANSAC迭代到≈850,大大加快处理速度。评估了与所有其他测试方法相比,逐渐增加的内联比如何改变3DSmoothNet的性能(图7)。当τ2=0.2时,所有其他方法的平均召回率都低于30%,而(16)(蓝色)和(32)(橙色)的召回率分别高达62%和72%。只要3dsmouthNet替换现有的描述符,任何基于描述符的点云注册管道都可以变得更加高效。

由于内存限制,3DMatch使用边缘等于1.5 m的体素网格。ETH数据集的结果报告在表3中。3DSmoothNet的平均性能最好(右栏),本文平均召回率为79.0%,明显优于平均召回率为48.2%,因为它的输出维度更大。(32人)以超过15%的分数击败亚军(无监督),而所有最先进的方法都显著低于30%。事实上,(32)应用于室外激光扫描仍然优于所有在3DMatch数据集上接受训练和测试的竞争对手(参见表1,表3)。

将3DMatch测试片段上每个兴趣点的方法平均运行时间与Tab4中的[49]进行比较(与Intel Xeon E5-1650、32 GB ram和NVIDIA GeForce GTX1080运行在同一台PC上)。注意,输入准备(input prep.)和[49]的推断是在GPU上处理的,在CPU上以当前状态进行输入准备。

3D点云完美匹配的更多相关文章

  1. segMatch:基于3D点云分割的回环检测

    该论文的地址是:https://arxiv.org/pdf/1609.07720.pdf segmatch是一个提供车辆的回环检测的技术,使用提取和匹配分割的三维激光点云技术.分割的例子可以在下面的图 ...

  2. 3D点云配准算法简述

    ​蝶恋花·槛菊愁烟兰泣露 槛菊愁烟兰泣露,罗幕轻寒,燕子双飞去. 明月不谙离恨苦,斜光到晓穿朱户. 昨夜西风凋碧树,独上高楼,望尽天涯路. 欲寄彩笺兼尺素.山长水阔知何处? --晏殊 导读: 3D点云 ...

  3. 3D点云几何拟合

    3D点云几何拟合 Supervised Fitting of Geometric Primitives to 3D Point Clouds 论文地址: http://openaccess.thecv ...

  4. 3D点云深度学*

    3D点云深度学* 在自动驾驶中关于三维点云的深度学*方法应用.三维场景语义理解的方法以及对应的关键技术介绍. 1. 数据 但是对于3D点云,数据正在迅速增长.大有从2D向3D发展的趋势,比如在open ...

  5. 2020厦门大学综述翻译:3D点云深度学习(Remote Sensiong期刊)

    目录 摘要 1.引言: 2.点云深度学习的挑战 3.基于结构化网格的学习 3.1 基于体素 3.2 基于多视图 3.3 高维晶格 4.直接在点云上进行的深度学习 4.1 PointNet 4.2 局部 ...

  6. css3实践之摩天轮式图片轮播+3D正方体+3D标签云(perspective、transform-style、perspective-origin)

    本文主要通过摩天轮式图片轮播的例子来讲解与css3 3D有关的一些属性. demo预览: 摩天轮式图片轮播(貌似没兼容360 最好用chrome) 3D正方体(chrome only) 3D标签云(c ...

  7. ZOJ-3933 Team Formation (二分图最佳完美匹配)

    题目大意:n个人,分为两个阵营.现在要组成由若干支队伍,每支队伍由两个人组成并且这两个人必须来自不同的阵营.同时,每个人都有m个厌恶的对象,并且厌恶是相互的.相互厌恶的人不能组成一支队伍.问最多能组成 ...

  8. UVA 11383 Golden Tiger Claw(最佳二分图完美匹配)

    题意:在一个N*N的方格中,各有一个整数w(i,j),现在要求给每行构造row(i),给每列构造col(j),使得任意w(i,j)<=row(i)+col(j),输出row(i)与col(j)之 ...

  9. UVa 1349 (二分图最小权完美匹配) Optimal Bus Route Design

    题意: 给出一个有向带权图,找到若干个圈,使得每个点恰好属于一个圈.而且这些圈所有边的权值之和最小. 分析: 每个点恰好属于一个有向圈 就等价于 每个点都有唯一后继. 所以把每个点i拆成两个点,Xi  ...

随机推荐

  1. hdu4499 搜索

    题意:       给你一个棋盘,最大是5*5的,问你最多可以放多少个炮,炮和炮之间不可以相互攻击,这块只的是只能走一步,不存在两个炮中间三个棋子的情况.. 思路:    刚开始想的是把所有的空位置都 ...

  2. hdu4022 map+multiset

    题意:       给你一些敌人的坐标,每次让你删除某一行或者某一列,问你每一次操作能删除多少人..... 思路:       map和multiset的完美结合,吧set定义到map里,达到一个一对 ...

  3. POJ2669不错的最大流 竞赛问题(枚举King的个数)

    题意:       有n个人,任意两个人都比一次赛(一共比了n*(n-1)/2场),赢一场得到一分,最后的时候如果得分最高,或者是自己打败了所有比自己得分都高的人就算是King,给你每个人的最后得分, ...

  4. JWT(Json Web Token)认证

    目录 JWT(Json Web Token) JWT的数据结构 JWT的用法 JWT验证流程

  5. 【pytest系列】- mark标记功能详细介绍

    如果想从头学起pytest,可以去看看这个系列的文章! https://www.cnblogs.com/miki-peng/category/1960108.html mark标记 ​ 在实际工作中, ...

  6. 【CSS】CSS3从入门到深入(复习查漏向

    CSS3从入门到深入(复习查漏向 pre_section CSS:层叠样式表,决定网页表现 网页为多层结构,CSS为每一层设置样式,最后显示最上一层 CSS语句 = 选择器 + 声明块 形式 内联样式 ...

  7. 【python】Leetcode每日一题-前缀树(Trie)

    [python]Leetcode每日一题-前缀树(Trie) [题目描述] Trie(发音类似 "try")或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的 ...

  8. 关于MDI多文档程序的一些思考

    MDI程序的框架 客户窗口是一个预定义的窗口类(MDICLIENT),它是框架窗口的子窗口同时也是各个子文档窗口的父窗口.框架窗口和各个子文档窗口都是自定义的窗口类. MDI程序中的一些要点 窗口中的 ...

  9. utf8改成utf8mb4实战教程

    前言: 在 MySQL 中,系统支持诸多字符集,不同字符集之间也略有区别.目前最常用的字符集应该是 utf8 和 utf8mb4 了,相比于 utf8 ,utf8mb4 支持存储 emoji 表情,使 ...

  10. python分析《三国演义》,谁才是这部书的绝对主角(包含统计指定角色的方法)

    前面分析统计了金庸名著<倚天屠龙记>中人物按照出现次数并排序 https://www.cnblogs.com/becks/p/11421214.html 然后使用pyecharts,统计B ...