SLAM与AI的强强联合
SLAM与AI的强强联合
本文默认大家已经熟知SLAM、导航、常见AI算法(比如深度学习、强化学习、卷积神经网络、监督学习)等基本概念,不熟的小伙伴可以从我已经出版的书籍《机器人SLAM导航核心技术与实战》中进行系统性的学习。AI与SLAM的结合大致分为3个思路:
- 思路1:用AI实现SLAM的所有功能
- 思路2:用AI改进SLAM的部分功能
- 思路3:介于思路1和思路2之间
第1种思路就是简单粗暴地用AI直接实现SLAM,也就是所谓的端到端方法(End-to-End),下面即将介绍的UnDeepVO和NeuralRecon就是典型代表。第2中思路是用AI改进SLAM中的个别功能模块,比如基于AI方法的特征匹配、重定位、深度估计、语义理解等,比如CNN-SLAM就是典型代表。当然更多的是介于思路1和思路2之间的方法,所以很多算法其实很难对其进行分类。为了方便讨论,下面仅从解决具体问题的角度介绍一些比较有代表性的AI+SLAM方法,包括:端到端视觉里程计、端到端建图、端到端定位导航、特征匹配、重定位、深度估计、语义理解、语义SLAM。
温馨提示
一、端到端视觉里程计
1.基于无监督深度学习的单目视觉里程计:
关键词:单目相机实时位姿估计、单目图像深度信息重建
论文:UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning
源码:-
年份:2018
2.基于自监督学习的运动估计:
关键词:自监督学习、位姿估计、深度重建
论文:Beyond Photometric Loss for Self-Supervised Ego-Motion Estimation
源码:https://github.com/hlzz/DeepMatchVO
年份:2019
二、端到端建图
1.单目相机实时连续三维建图:
关键词:单目相机、神经网络、TSDF、三维建图
论文:NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video
源码:https://github.com/zju3dv/NeuralRecon
年份:2021
2.半监督单目稠密重建:
关键词:半监督、稠密重建、单目
论文:MonoRec:Semi-Supervised Dense Reconstruction in Dynamic Environments from a Single Moving Camera
源码:https://github.com/Brummi/MonoRec
年份:2021
三、端到端定位导航
1.可变端到端定位与导航:
关键词:端到端、定位、导航
论文:Variational End-to-End Navigation and Localization
源码:-
年份:2019
四、特征匹配
1.基于深度学习特征提取的路标特征匹配:
关键词:深度学习、特征提取、特征匹配
论文:Improving Keypoint Matching Using a Landmark-Based Image Representation
源码:https://github.com/Hansry/Keypoint-Matching-Based-on-Landmark-Representation
年份:2019
2.基于深度学习的2D图像到3D点云的特征匹配:
关键词:深度学习、2D图像、3D点云、特征匹配
论文:2D3D-MatchNet: Learning to Match Keypoints Across 2D Image and 3D Point Cloud
源码:-
年份:2019
五、重定位
1.基于深度学习视觉位置识别的重定位:
关键词:卷积神经网络、路标定位网络、视觉位置识别
论文:Localizing Discriminative Visual Landmarks for Place Recognition
源码:-
年份:2019
2.基于迁移学习的视觉位置识别:
关键词:迁移学习、视觉位置识别
论文:A Multi-Domain Feature Learning Method for Visual Place Recognition
源码:
年份:2019
六、深度估计
1.基于深度学习的深度估计:
关键词:深度估计、深度学习
论文:Geo-Supervised Visual Depth Prediction
源码:https://github.com/feixh/GeoSup
年份:2019
七、语义理解
1.自动驾驶的实时语义推理:
关键词:街道分类、车辆识别、道路分割
论文:MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving
源码:https://github.com/MarvinTeichmann/MultiNet
年份:2018
2.实时语义分割网络:
关键词:跳跃结构、UNet、扩张前端
论文:SHUFFLESEG: REAL-TIME SEMANTIC SEGMENTATION NETWORK
源码:https://github.com/MSiam/TFSegmentation
年份:2018
3.基于自组织网络的点云语义解析:
关键词:自组织网络、点云特征提取、点云语义解析
论文:SO-Net: Self-Organizing Network for Point Cloud Analysis
源码:https://github.com/lijx10/SO-Net
年份:2018
八、语义SLAM
1.基于卷积神经网络的稠密三维语义建图:
关键词:语义建图、三维稠密、卷积神经网络
论文:SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks
源码:https://github.com/seaun163/semanticfusion
年份:2016
2.基于CNN语义融合的SLAM:
关键词:CNN、SLAM、语义融合
论文:CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction
源码:https://github.com/iitmcvg/CNN_SLAM
年份:2017
参考文献
[1] 张虎,机器人SLAM导航核心技术与实战[M]. 机械工业出版社,2022.

SLAM与AI的强强联合的更多相关文章
- Learning ROS for Robotics Programming - Second Edition(《ROS机器人编程学习-第二版》)
Learning ROS for Robotics Programming - Second Edition <ROS机器人编程学习-第二版> ----Your one-stop guid ...
- 目前大热的AI和SLAM的职业发展的想法
目前,AI的研究和SLAM的发展已经走到使用领域.还记得三年前,上<信息光学>的老师在课上提到,他有一个研究生买了一个两万块的笔记本,还要出国去研究人工智能,当时听着认为这位学长很疯狂.可 ...
- [SLAM] Studying Guidance
Books from Zhihu: 幽默一把 看完Gonzalez:嗯,好像很好玩的样子,我也来搞一搞.看完Price:什么鬼,怎么这么多公式,公式看不懂肿么破.看完Szeliski:原来用一千页的书 ...
- 光环国际联合阿里云推出“AI智客计划”
2018阿里巴巴云栖大会深圳峰会3月28日.29日在大中华喜来登酒店举行,阿里云全面展示智能城市.智能汽车.智能生活.智能制造等产业创新. 3月28日下午,以"深化产教融合,科技赋能育人才& ...
- SLAM+语音机器人DIY系列:(三)感知与大脑——5.机器人大脑嵌入式主板性能对比
摘要 在我的想象中机器人首先应该能自由的走来走去,然后应该能流利的与主人对话.朝着这个理想,我准备设计一个能自由行走,并且可以与人语音对话的机器人.实现的关键是让机器人能通过传感器感知周围环境,并通过 ...
- AI时代大点兵-国内外知名AI公司2018年最新盘点
AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国 ...
- 如何从零开始系统化学习视觉SLAM?
由于显示格式问题,建议阅读原文:如何从零开始系统化学习视觉SLAM? 什么是SLAM? SLAM是 Simultaneous Localization And Mapping的 英文首字母组合,一般翻 ...
- 【将门创投】AI 往期技术分享
计算机视觉 1. 嘉宾:商汤科技CEO 徐立 文章回顾:计算机视觉的完整链条,从成像到早期视觉再到识别理解 2. 嘉宾:格灵深瞳CTO 赵勇 文章回顾:计算机视觉在安防.交通.机器人.无人车等领域的应 ...
- 本人AI知识体系导航 - AI menu
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯 徐亦达老板 Dirichlet Process 学习 ...
- info AI drive
Who we look for Here at comma, we don't care about the source of your education or your traditional ...
随机推荐
- c# Lamda表达式 简化语法例子
看到一个老代码里的方法,是判断两个string 数组是否存在相同的元素: 快一百行代码了..... public bool HasRole(string[] roleList) { bool resu ...
- 学习shamir秘密分享
介绍 1979年Shamir在下文提出基于拉格朗日插值多项式的\((r,n)\)秘密共享方案(\(0<r \leq n\)).秘密拥有者通过构建一元多项式将秘密分为\(n\)份,接收方收集大于等 ...
- Kotlin:反引号中的函数命名、匿名函数、函数类型与隐式返回
- .NET9 AOT部署
概念 AOT是Ahead-of-Time的缩写,AOT是将C#程序提前编译为机器代码(通常为平台特定的二进制文件),在应用程序启动之前完成编译过程. 微软官方文档是这样说的 将应用程序发布为本机 AO ...
- 记一次DAC转换功能修改的解决
最近的项目捣鼓msp430需要用到dac转换以输出模拟信号,项目代码是接手前同事的 有些地方调试不通,以前没有接触过msp430芯片,更是没搞过这种芯片io口时序驱动层的东西,甚至纯c的都是头一次作为 ...
- CRISP-DM的应用与理解
本文分享自天翼云开发者社区<CRISP-DM的应用与理解>,作者:吴****嫄 CRISP-DM是一个数据挖掘项目规划的开放标准流程框架模型,主要分为业务理解.数据理解.数据准备.建模.评 ...
- nacos(二):原生java调用配置与服务实例
本文主要介绍原生java连接nacos,操作nacos的共享配置与服务实例. 1.引入依赖 <dependencies> <dependency> <groupId> ...
- 面试必备!HR面常问的20个问题及高分回答秘诀
HR面试一般会花大约20分钟,主要会问一些个人情况.处理事情的方法.工作经验.成长经历等相关问题. 当你到了HR面,基本上就代表你的面试已经通过了一大半了.不过,还是不要掉以轻心,HR面还是有可能会挂 ...
- 【COM3D2Mod 制作教程(2)】Mod 底层原理
[COM3D2Mod 制作教程(2)]Mod 底层原理 Mod 是什么? Mod 一词想必你已经听过很多次了,因为很多游戏都可以装 Mod,而 Mod 可以为游戏增添一些额外的乐趣.但在 COM3D2 ...
- nacos(七): gateway(单体)
这篇文章将从gateway的搭建.自动路由匹配.路由数组.跨域和路由过滤器五个方面对gateway项目展开讨论. 1.gateway的搭建 gateway的项目基本的搭建过程与消费者的搭建过程基本一致 ...