SLAM与AI的强强联合
SLAM与AI的强强联合
本文默认大家已经熟知SLAM、导航、常见AI算法(比如深度学习、强化学习、卷积神经网络、监督学习)等基本概念,不熟的小伙伴可以从我已经出版的书籍《机器人SLAM导航核心技术与实战》中进行系统性的学习。AI与SLAM的结合大致分为3个思路:
- 思路1:用AI实现SLAM的所有功能
- 思路2:用AI改进SLAM的部分功能
- 思路3:介于思路1和思路2之间
第1种思路就是简单粗暴地用AI直接实现SLAM,也就是所谓的端到端方法(End-to-End),下面即将介绍的UnDeepVO和NeuralRecon就是典型代表。第2中思路是用AI改进SLAM中的个别功能模块,比如基于AI方法的特征匹配、重定位、深度估计、语义理解等,比如CNN-SLAM就是典型代表。当然更多的是介于思路1和思路2之间的方法,所以很多算法其实很难对其进行分类。为了方便讨论,下面仅从解决具体问题的角度介绍一些比较有代表性的AI+SLAM方法,包括:端到端视觉里程计、端到端建图、端到端定位导航、特征匹配、重定位、深度估计、语义理解、语义SLAM。
温馨提示
一、端到端视觉里程计
1.基于无监督深度学习的单目视觉里程计:
关键词:单目相机实时位姿估计、单目图像深度信息重建
论文:UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning
源码:-
年份:2018

2.基于自监督学习的运动估计:
关键词:自监督学习、位姿估计、深度重建
论文:Beyond Photometric Loss for Self-Supervised Ego-Motion Estimation
源码:https://github.com/hlzz/DeepMatchVO
年份:2019

二、端到端建图
1.单目相机实时连续三维建图:
关键词:单目相机、神经网络、TSDF、三维建图
论文:NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video
源码:https://github.com/zju3dv/NeuralRecon
年份:2021

2.半监督单目稠密重建:
关键词:半监督、稠密重建、单目
论文:MonoRec:Semi-Supervised Dense Reconstruction in Dynamic Environments from a Single Moving Camera
源码:https://github.com/Brummi/MonoRec
年份:2021

三、端到端定位导航
1.可变端到端定位与导航:
关键词:端到端、定位、导航
论文:Variational End-to-End Navigation and Localization
源码:-
年份:2019

四、特征匹配
1.基于深度学习特征提取的路标特征匹配:
关键词:深度学习、特征提取、特征匹配
论文:Improving Keypoint Matching Using a Landmark-Based Image Representation
源码:https://github.com/Hansry/Keypoint-Matching-Based-on-Landmark-Representation
年份:2019

2.基于深度学习的2D图像到3D点云的特征匹配:
关键词:深度学习、2D图像、3D点云、特征匹配
论文:2D3D-MatchNet: Learning to Match Keypoints Across 2D Image and 3D Point Cloud
源码:-
年份:2019

五、重定位
1.基于深度学习视觉位置识别的重定位:
关键词:卷积神经网络、路标定位网络、视觉位置识别
论文:Localizing Discriminative Visual Landmarks for Place Recognition
源码:-
年份:2019

2.基于迁移学习的视觉位置识别:
关键词:迁移学习、视觉位置识别
论文:A Multi-Domain Feature Learning Method for Visual Place Recognition
源码:
年份:2019

六、深度估计
1.基于深度学习的深度估计:
关键词:深度估计、深度学习
论文:Geo-Supervised Visual Depth Prediction
源码:https://github.com/feixh/GeoSup
年份:2019

七、语义理解
1.自动驾驶的实时语义推理:
关键词:街道分类、车辆识别、道路分割
论文:MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving
源码:https://github.com/MarvinTeichmann/MultiNet
年份:2018

2.实时语义分割网络:
关键词:跳跃结构、UNet、扩张前端
论文:SHUFFLESEG: REAL-TIME SEMANTIC SEGMENTATION NETWORK
源码:https://github.com/MSiam/TFSegmentation
年份:2018

3.基于自组织网络的点云语义解析:
关键词:自组织网络、点云特征提取、点云语义解析
论文:SO-Net: Self-Organizing Network for Point Cloud Analysis
源码:https://github.com/lijx10/SO-Net
年份:2018

八、语义SLAM
1.基于卷积神经网络的稠密三维语义建图:
关键词:语义建图、三维稠密、卷积神经网络
论文:SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks
源码:https://github.com/seaun163/semanticfusion
年份:2016

2.基于CNN语义融合的SLAM:
关键词:CNN、SLAM、语义融合
论文:CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction
源码:https://github.com/iitmcvg/CNN_SLAM
年份:2017

参考文献
[1] 张虎,机器人SLAM导航核心技术与实战[M]. 机械工业出版社,2022.

SLAM与AI的强强联合的更多相关文章
- Learning ROS for Robotics Programming - Second Edition(《ROS机器人编程学习-第二版》)
Learning ROS for Robotics Programming - Second Edition <ROS机器人编程学习-第二版> ----Your one-stop guid ...
- 目前大热的AI和SLAM的职业发展的想法
目前,AI的研究和SLAM的发展已经走到使用领域.还记得三年前,上<信息光学>的老师在课上提到,他有一个研究生买了一个两万块的笔记本,还要出国去研究人工智能,当时听着认为这位学长很疯狂.可 ...
- [SLAM] Studying Guidance
Books from Zhihu: 幽默一把 看完Gonzalez:嗯,好像很好玩的样子,我也来搞一搞.看完Price:什么鬼,怎么这么多公式,公式看不懂肿么破.看完Szeliski:原来用一千页的书 ...
- 光环国际联合阿里云推出“AI智客计划”
2018阿里巴巴云栖大会深圳峰会3月28日.29日在大中华喜来登酒店举行,阿里云全面展示智能城市.智能汽车.智能生活.智能制造等产业创新. 3月28日下午,以"深化产教融合,科技赋能育人才& ...
- SLAM+语音机器人DIY系列:(三)感知与大脑——5.机器人大脑嵌入式主板性能对比
摘要 在我的想象中机器人首先应该能自由的走来走去,然后应该能流利的与主人对话.朝着这个理想,我准备设计一个能自由行走,并且可以与人语音对话的机器人.实现的关键是让机器人能通过传感器感知周围环境,并通过 ...
- AI时代大点兵-国内外知名AI公司2018年最新盘点
AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国 ...
- 如何从零开始系统化学习视觉SLAM?
由于显示格式问题,建议阅读原文:如何从零开始系统化学习视觉SLAM? 什么是SLAM? SLAM是 Simultaneous Localization And Mapping的 英文首字母组合,一般翻 ...
- 【将门创投】AI 往期技术分享
计算机视觉 1. 嘉宾:商汤科技CEO 徐立 文章回顾:计算机视觉的完整链条,从成像到早期视觉再到识别理解 2. 嘉宾:格灵深瞳CTO 赵勇 文章回顾:计算机视觉在安防.交通.机器人.无人车等领域的应 ...
- 本人AI知识体系导航 - AI menu
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯 徐亦达老板 Dirichlet Process 学习 ...
- info AI drive
Who we look for Here at comma, we don't care about the source of your education or your traditional ...
随机推荐
- Redis中缓存预热、击穿、雪崩等问题解决方案-copy
1.缓存雪崩 缓存雪崩是指缓存同一时间大面积的失效,所以,后面的请求都会落到数据库上,造成数据库短时间内承受大量请求而崩掉. 解决方案 缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生. ...
- Pipe pg walkthrough Intermediate
NAMP ┌──(root?kali)-[~] └─# nmap -p- -A 192.168.128.45 Starting Nmap 7.95 ( https://nmap.org ) at 20 ...
- VulNyx - Mail 靶机
扫描靶机 发现22 和 80端口 访问80端口 发现id=1 和2 时都会有回显 dirsearch -u http://http://192.168.200.39 访问这个1 和 2的路径 发现竟然 ...
- ctfshow--web7 sql注入空格过滤
?id=10//union//select//1,database(),3//%23查看库名 查看表名 -1/**/union/**/select/**/1,(select/**/group_conc ...
- C#中根据传入的字符串字段返回实体Lambda表达式
我们在操作实体的时候,经常会使用到Lambda表达式,如下所示就是对实体IOT_Sample的CrtTime进行操作: var ret = NestExtension.GetSort<IOT_S ...
- FLink15--滑动窗口--SlidingWindiwApp
一.依赖 https://www.cnblogs.com/robots2/p/16048648.html 二.代码 概念:滑动窗口有两个参数,窗口大小20和滑动大小6,6秒滑一次,统计近20秒数据 前 ...
- IDEA中使用Yapi上传接口
一.Idea下载插件YapiUpload 二.修改该项目的隐藏文件夹idea .idea文件下修改misc.xml增加如下配置 <component name="yapi" ...
- 牛客题解 | 单组_spj判断数组之和
题目 题目链接 解题思路 后台有spj代码,能对同学们的输出数据进行校验,符合条件即可通过. 附赠 spj 代码 #include <iostream> #include <fstr ...
- QT5笔记: 25. 非模态的自定义对话框
窗口对象为QDialog 显示方法为 show(); locateCell->show(); 可以通过public方法或者信号槽机制获取非模态窗口的信息 例子:非模态窗口,为主窗口数据输入吧 v ...
- 深入理解 Docker 容器技术
一.引言 在当今的云计算和软件开发领域,Docker 容器技术已经成为了一项不可或缺的工具.它极大地改变了应用程序的部署和运行方式,为开发者和运维人员带来了诸多便利. 二.Docker 容器是什么? ...