三维重建5：场景中语义分析/语义SLAM/DCNN-大尺度SLAM

前言：

在实时/非实时大规模三维场景重建中，引入了语义SLAM这个概念，参考三维重建：SLAM的尺度和方法论问题和三维重建：SLAM的粒度和工程化问题。大规模三维场景重建的尺度增大，因此相对于整个重建过程的粒度也从点到特征点到目标物体级别，对场景进行语义标记成为重要的工作。

场景语义标记的传统方法：

其他：机器人在线场景感知问题，场景识别问题。

参考文章：场景感知：图像的稀疏表示

对场景进行目标检测，并串联目标特征或者打包成set，形成场景特征。根据场景特征进行分类场景，既是场景感知。对于大量需要感知的场景，既是场景中有多类物体，形成的场景特征的向量维数变得更大更长，为了降低计算量，引入了稀疏编码的方法。

深度学习的语义标记方法：

对于超大环境，比如整个中国建立一个三维地图，Agent端的存储能力和计算能力必定达不到海量数据存储和检索的要求。因此，引入C/S模式的云端框架是合适的选择。对于超量的类别进行模式识别，传统的集成学习仍然遇到理论上的困难，比如VC维的约束。因此，基于深度学习的场景语义识别是暂时最佳可选的方案，Agent作为一个数据获取端，把数据传输到云端服务器，在服务器上使用DCNN进行语义检测，用于检测目标和场景，进而判断是否存在闭环/Agent在场景中的位姿。

语义SLAM的关键元素

目标检测、场景识别、DCNN。

目标识别的传统方法经典方法利用概率图模型（CRF）对图片进行分割，使用传统模式识别方法进行目标识别（SVM、随机森林等），这些传统方法应对海量数据和高精度的挑战都成问题，比如CRF模型对于大量数据训练极为困难、模式识别方法模型本身就受到VC维的约束。

场景识别的传统方法如前面所述，使用稀疏编码的方式对每一类场景进行稀疏编码，把图片场景识别拖入模式识别的范畴，使用传统模式识别的方法完成场景识别。

DCNN

对于检测-识别过程，传统方法的一般模式是，需要对图像进行特征提取，把图像从二维张量空间转化到N维向量空间，称为特征提取；再通过模式识别方法把N维向量空间压缩到0维空间的离散个点上。由此完成分类识别。

在此过程中，特征提取是一个专家知识极浓的经验过程，并在图像压缩转化过程中必然承受着压缩/特征提取损失。

CNN具有图像处理过程中张量压缩的天然结构。CNN结构直接把图像在二维张量空间中进行处理，不停的Conv和polling，使用数据来完成~~特征提取，更多的数据得出更可靠的特征~~（特征一词对于CNN没有实际意义，此过程并非形式化，且可以表示为任一步及几步的组合）。不停的Conv和polling，直至图像的X*X像素收敛为1*1，直接把图像从二维张量空间压缩到一维向量空间中的点（也可以称之为二维张量空间上的点，但没有了明确的维度限制）上。

此外，CNN的二维链接结构，可以使用权值共享和分层乘法来降低参数数量，以至于在添加更多的类别时避免造成参数的指数级增长（传统方法随类别的参数增长一般是指数级别或者亚指数级别的，至少是超多项式的）。

深度学习方法作为分类模型，发展已久，从AlexNet到GoogleNet，到Residual Network，不断取得更高的精度和处理更多的类别以及获得更快的速度。

深度学习作为检测模型，经典网络为R-CNN和Yolo-DarkNet，随后更新了多个版本，基于Region Proposal的网络为R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、R-FCN和Mask RCNN；基于Regression的有Yolo、SSD-Net、YoloV2、LocalNet等。

DCNN检测模型

基于Region Proposal的网络为R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、R-FCN和Mask RCNN；基于Regression的有Yolo、SSD-Net、YoloV2、LocalNet等。

参考文章：SPP-Net：CNNs添加一尺度不变特征-神经元层

参考文章：Going deeper with convolutions：卷积的更深一些

参考文章：CVPR 2016论文快讯：目标检测领域的新进展

工程化问题

语义SLAM中大规模语义分析，通常方法也变为S端使用DCNN做服务器实现场景检测/闭环检测和C端Agent根据返还结果辅助实现三维位姿确定。

三维重建5：场景中语义分析/语义SLAM/DCNN-大尺度SLAM的更多相关文章

TensorFlow中的语义分割套件
TensorFlow中的语义分割套件描述该存储库用作语义细分套件.目标是轻松实现,训练和测试新的语义细分模型!完成以下内容: 训练和测试方式资料扩充几种最先进的模型.轻松随插即用能够使用任何 ...
三维重建：SFM中BA的并行化
1. BA在重建中的作用借鉴于运动中重建的方法,BA引入SLAM过程,而传统的滤波方法引入BA是跟随闭环检测出现. 1.1 BA在滤波方法中的嵌入 PTAM 1.2 BA在闭环检测之后的应用在三维 ...
第七章人工智能，7.6 DNN在搜索场景中的应用(作者：仁重)
7.6 DNN在搜索场景中的应用 1. 背景搜索排序的特征分大量的使用了LR,GBDT,SVM等模型及其变种.我们主要在特征工程,建模的场景,目标采样等方面做了很细致的工作.但这些模型的瓶颈也非常的 ...
三维场景中使用BillBoard技术
三维场景中对于渲染效果不是很精致的物体可以使用BillBoard技术实现,使用该技术需要将物体实时朝向摄像机,即计算billboard的旋转矩阵M. 首先根据摄像机位置cameraPos和billBo ...
LoadRunner测试场景中添加负载生成器
如何在LoadRunner测试场景中添加负载生成器本文对如何在LoadRunner的测试场景中添加负载生成器,如何使用负载生成器的方法,总结形成操作指导手册,以指导测试人员指导开展相关工作. 1.什 ...
[python]在场景中理解装饰器
原来我也自己通过查资料,来学习python的装饰器,但是效果不好.因为没有接触过需要用到装饰器的场景,所以一起的资料都只停留在纸面上,但是今天偶然看到了vimer的这篇文章:http://www.v ...
SharpGL学习笔记(十二) 光源例子：解决光源场景中的常见问题
笔者学到光源这一节,遇到的问题就比较多了,收集了一些如下所述: (1) 导入的3ds模型,如果没有材质光照效果很奇怪．如下图 (2) 导入的3ds模型,有材质,灯光效果发暗,材质偏色,效果也很奇怪． ...
Loadrunner：场景中添加负载生成器
场景中添加负载生成器: (1)远程机子(假设ip为192.168.134.23)开启负载生成器开始菜单找到:LoadRunner Agent Process 开启后任务栏会显示如下图: (2)场景中 ...
[Unity3D]Unity3D游戏开发之在3D场景中选择物体并显示轮廓效果
大家好,我是秦元培,欢迎大家关注我的博客,我的博客地址是blog.csdn.net/qinyuanpei. 在<仙剑奇侠传>.<古剑奇谭>等游戏中,常常须要玩家在一个3D场景中 ...

随机推荐

【codeforces 509E】Pretty Song
[题目链接]:http://codeforces.com/contest/509/problem/E [题意] 让你计算一个字符串的所有子串里面元音字母出现的频率的和; [题解] 先处理出前缀和-&g ...
清北学堂模拟赛d3t5 c
分析:其实就是一道数学题.如果以左下角的点为原点建立平面直角坐标系,那么点(b,a)是最容易卡住棺材的.我们求出棺材左边到点(b,a)的距离最小值,只有w小于等于这个最小值才能被拉过去.那么先求出左面 ...
N天学习一个linux命令之ip
用途 show / manipulate routing, devices, policy routing and tunnels 用法通用格式 ip [ OPTIONS ] OBJECT { CO ...
N天学习一个linux命令之lsof
用途列出进程已打开的文件,文件可以是常规文件,特殊文件,目录,socket,设备,共享库等.如果不带参数,lsof显示所有进程打开的所有文件. 用法 lsof [ -?abChlnNOPRtUvVX ...
Libs文件夹下的Jar文件为什么不会自己主动放在Android Private Libraries文件夹下
简而言之:这个问题就是由jar包反复冲突了! 这个问题一開始我出现了一种"自以为是"的答案,在Android Private Libraries文件夹下的是会打包到project可 ...
[Cypress] Interact with Hidden Elements in a Cypress Test
We often only show UI elements as a result of some user interaction. Cypress detects visibility and ...
BZOJ 1605 [Usaco2008 Open]Crisis on the Farm 牧场危机 DP
题意:链接方法: DP 解析: 第一眼搜索题,复杂度不同意dfs,并且牛的数量太多不能bfs,迭代更不可能,A*不会估价.可能记忆化? 等等记忆化我还搜个毛线- 直接改成DP就好了. 状态非常好想非 ...
怎样在BIOS中设置RAID？
随着价格的下降和相应主板的支持.眼下SATA硬盘已经逐渐成为主流. 但因为受芯片组和操作系统的影响.不少用户对SATA硬盘的使用及安装系统掌握不足,今天小编就给大家介绍一下SATA硬盘的日常应用技巧. ...
【HDU 4870】Rating【DP】
题意:一个人注冊两个账号,初始rating都是0,他每次拿低分的那个号去打比赛,赢了加50分,输了扣100分.胜率为p,他会打到直到一个号有1000分为止,问比赛场次的期望. 题解:因为每次添加分数或 ...
codeforces #262 DIV2 B题 Little Dima and Equation
题目地址:http://codeforces.com/contest/460/problem/B 这题乍一看没思路.可是细致分析下会发现,s(x)是一个从1到81的数,不管x是多少.所以能够枚举1到8 ...

三维重建5：场景中语义分析/语义SLAM/DCNN-大尺度SLAM

三维重建5：场景中语义分析/语义SLAM/DCNN-大尺度SLAM的更多相关文章

随机推荐

热门专题