[摘抄] SFM 和 Visual SLAM

来自知乎：

　　SFM和vSLAM基本讨论的是同一问题，不过SFM是vision方向的叫法，而vSLAM是robotics方向的叫法。

　　vSLAM所谓的mapping，vision方向叫structure；vSLAM所谓的location，我们vision方向叫camera pose。

但是从出发点考虑的话，SFM主要是要完成3D reconstuction，而vSLAM主要是要完成localization。这样设计的优化目标就完全不同了。

　　从方法论的角度上考虑的话，传统的SFM是不要求prediction的，real-time是不要求的。但是对于vSLAM而言prediction是必须的，因为vSLAM的终极目标是要real-time navigation。

而传统的vSLAM也把主要精力放在prediction上面，而且是借助非camera的外界的手段来predict（运动模型？状态方程？），例如acceleration sensor。

传统SFM则把精力放在feature tracking上面了。

　　直到最近，SFM开始利用图片间的optical flow做prediction，而vSLAM则更加的注重了feature tracking。所以就目前而言两个领域似有大融和趋势。

Andres Davison做了一个非常精彩的关于15年来基于视觉的SLAM的总结。过去10-15年来最典型的几个SLAM系统如下：

MonoSLAM
PTAM
FAB-MAP
DTAM
KinectFusion

　　日常场景，基于多视角Multi-view重建，不使用RGBD方式的话，就选SfM（Structure from Motion）+MVS（Multi View Stereo）+SR（Surface Reconstruction）+TM（Texture Mapping）套路啦，这是传统基于多视几何的路子，原理就是利用多张图像间的特征点匹配求解相机内外参数和三维空间点的位置，也就是稀疏点云（一堆点），之后再让它浓一点，变成连续的，再加点颜色和纹理，data flow大致是：

　　当然做到dense点云的话看起来就比较逼真了，想把点连起来变成连续多边形网格（也就是表面）再加上纹理信息，就是可以各种玩的3D模型了。商业软件很多了，上面已经有一些不错的例子，Pix4Dmapper是一款专门用于无人机航拍图像重建的产品，效率质量惊人，当然用于地面场景应用也是可以的。如果不怕麻烦的话，这里主要介绍一些research的例子：

SfM：大家比较熟悉的就是Changchang Wu的 VisualSFM 啦，这是个写的比较溜的非开源福利，Changchang大神一致不公开源码，是他一行行累出来的作品，其中的SiftGPU和PBA也是大神的作品。我也算用过一些不同的SfM代码，各路大神写的，包括一些大牛组的，讲良心VSFM算是我见过鲁棒性最好的之一（严谨脸），极少出现数据量太大、数据质量（各种因素blabla）差造成的崩、卡、完、“就是没结果”之类，虽说已有岁月包浆，但其精度和稳定性值得信赖的。非说槽点的话，也就是图像匹配和BA的效率不高，各种改进此处略去，如果只是用一下的话还是包您满意的。还有MVE、 OpenMVG （openMVG/openMVG）和 COLMAP（COLMAP - Structure-From-Motion and Multi-View Stereo），现在的框架都必须追求全面，所以稍微看下主页就会发现MVS等功能都是打包的。（bundler还是要说的，但是用起来稍微麻烦，不推荐上手玩）

MVS：PMVS、CMVS，CMPMVS，以及OpenMVS，各种dense层出不穷，本人代码能力有限，对于这块还是望而生畏的（顺吐一下，还是不要去自己编译OpenMVS了。。可能新版本已改观，未求证）。OpenMVS效果还是很赞的，虽说时常出现莫名的罢工，自带了VSFM和OpenMVG的接口，贴心。

SR和TM：CV，CG，CCTV，好吧，其实OpenMVS都有啦，请自行观看cdcseacave/openMVS。

另外，想自己翻来覆去把玩结果的话，Meshlab是很好的。

VisualSfM——OpenMVS，是一套比较简洁的方案，也可以把OpenMVS替换成CMPMVS。另外做重建数据是非常重要的，自己拍的话请尽量量大出奇迹，多一点视角，保证每次拍照位置的距离合适（基线），实在懒的话就上视频了，找个软件或者自己opencv弄成帧再喂进去（感兴趣的话opencv和matlab也可以自己写重建算法，有高质量库和工程，例如普林的SfM相关课程）。一次拍的不好，可以多拍几次，看下哪里空洞补哪里，新数据加进去再跑一次就好（特征点检测匹配等中间结果慎删）。

想更多了解原理，推荐一本经典教材《计算机视觉中的多视图几何》（Multiple View Geometry in Computer Vision），超级经典。

CCCV 2017讲习班笔记-基于图像的大规模场景三维重建

SFM的算法流程基本如下：

[摘抄] SFM 和 Visual SLAM的更多相关文章

三维重建7：Visual SLAM算法笔记
VSLAM研究了几十年,新的东西不是很多,三维重建的VSLAM方法可以用一篇文章总结一下. 此文是一个好的视觉SLAM综述,对视觉SLAM总结比较全面,是SLAM那本书的很好的补充.介绍了基于滤波器的 ...
泡泡一分钟：Topomap: Topological Mapping and Navigation Based on Visual SLAM Maps
Topomap: Topological Mapping and Navigation Based on Visual SLAM Maps Fabian Bl¨ochliger, Marius Feh ...
Visual SLAM
Visual SLAM 追求直接SLAM技术,而不是使用关键点,直接操作图像强度的跟踪和映射. 作为直接方法,LSD-SLAM使用图像中的所有信息,包括边缘,而基于关键点的方法只能在拐角处使用小块.这 ...
Comparison of Laser SLAM and Visual SLAM
Comparison of Laser SLAM and Visual SLAM 目前,SLAM技术广泛应用于机器人.无人机.无人机.AR.VR等领域,依靠传感器可以实现机器的自主定位.测绘.路径规划 ...
什么是视觉Visual SLAM
什么是视觉Visual SLAM What Is Visual SLAM? What are the origins of visual SLAM? and what are some other a ...
论文阅读：Robust Visual SLAM with Point and Line Features
本文提出了使用异构点线特征的slam系统,继承了ORB-SLAM,包括双目匹配.帧追踪.局部地图.回环检测以及基于点线的BA.使用最少的参数对线特征采用标准正交表示,推导了线特征重投影误差的雅克比矩阵 ...
[SLAM] 01 "Simultaneous Localization and Mapping" basic knowledge
发信人: leecty (Terry), 信区: ParttimeJobPost标题: 创业公司招SLAM 算法工程师发信站: 水木社区 (Thu Jun 16 19:18:24 2016), 站内 ...
(转) 实时SLAM的未来及与深度学习的比较
首页视界智尚算法技术每日技术来打我呀注册实时SLAM的未来及与深度学习的比较 The Future of Real-Time SLAM and “Deep Learni ...
[SLAM] 03. ORB-SLAM2
一年后再读SLAM~ 行业有了不少工程实践方面的突破一.链接:https://www.zhihu.com/question/53571648/answer/176732257 目前来说,受到业界肯定 ...

随机推荐

Python中_,__,__xx__的区别
_xx 单下划线开头 Python中没有真正的私有属性或方法,可以在你想声明为私有的方法和属性前加上单下划线,以提示该属性和方法不应在外部调用.如果真的调用了也不会出错,但不符合规范. #! /usr ...
kernel事件通知userspace
https://stackoverflow.com/questions/31646466/how-to-send-signal-from-kernel-to-user-space
mysql表空间加密 keyring encryption
从5.7.11开始,mysql开始支持物理表空间的加密,它使用两层加密架构.包括:master key 和 tablespace key master key用于加密tablespace key,加密 ...
mybatis打印完整的sql
mybatis log plugin
框架源码系列二：手写Spring-IOC和Spring-DI（IOC分析、IOC设计实现、DI分析、DI实现）
一.IOC分析 1. IOC是什么? IOC:Inversion of Control控制反转,也称依赖倒置(反转) 问题:如何理解控制反转? 反转:依赖对象的获得被反转了.由自己创建,反转为从IOC ...
springboot-custom starter
Spring Boot由众多Starter组成,随着版本的推移Starter家族成员也与日俱增.在传统Maven项目中通常将一些层.组件拆分为模块来管理, 以便相互依赖复用,在Spring Boot项 ...
基于【CentOS-7+ Ambari 2.7.0 + HDP 3.0】HAWQ数据仓库使用之 gpfdist协议
一.HAWQ基本安装自带gpfdist协议 gpfdist是HAWQ支持的外部表访问协议之一,这是hawq自带的一个简单的集成http服务命令. 在我的前述安装hawq之后,gpfdist命令位于ha ...
QT中事件处理器和事件过滤器实现实例
Qt中事件处理的方式,最常用的就是使用事件处理器(event handler)和事件过滤器(event filter)这两种方法.接下来,我们就来看看事件处理器和事件过滤器是怎么使用的. 事件处理器 ...
python中基本类型的连接组合和互相转换
本篇总结了一下字符串,列表,字典,元组的连接组合使用和类型的互相转换小例子,尤其列表中的extend()方法和字典中的 update方法非常的常用. 1.连接两个字符串 a = "hello ...
js 注意
1.如果想要动态加清除浮动的代码,可以这样做: document.getElementById("mainBody").innerHTML += "<div sty ...

[摘抄] SFM 和 Visual SLAM

[摘抄] SFM 和 Visual SLAM的更多相关文章

随机推荐

热门专题