SLAM与AI的强强联合
SLAM与AI的强强联合
本文默认大家已经熟知SLAM、导航、常见AI算法(比如深度学习、强化学习、卷积神经网络、监督学习)等基本概念,不熟的小伙伴可以从我已经出版的书籍《机器人SLAM导航核心技术与实战》中进行系统性的学习。AI与SLAM的结合大致分为3个思路:
- 思路1:用AI实现SLAM的所有功能
- 思路2:用AI改进SLAM的部分功能
- 思路3:介于思路1和思路2之间
第1种思路就是简单粗暴地用AI直接实现SLAM,也就是所谓的端到端方法(End-to-End),下面即将介绍的UnDeepVO和NeuralRecon就是典型代表。第2中思路是用AI改进SLAM中的个别功能模块,比如基于AI方法的特征匹配、重定位、深度估计、语义理解等,比如CNN-SLAM就是典型代表。当然更多的是介于思路1和思路2之间的方法,所以很多算法其实很难对其进行分类。为了方便讨论,下面仅从解决具体问题的角度介绍一些比较有代表性的AI+SLAM方法,包括:端到端视觉里程计、端到端建图、端到端定位导航、特征匹配、重定位、深度估计、语义理解、语义SLAM。
温馨提示
一、端到端视觉里程计
1.基于无监督深度学习的单目视觉里程计:
关键词:单目相机实时位姿估计、单目图像深度信息重建
论文:UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning
源码:-
年份:2018

2.基于自监督学习的运动估计:
关键词:自监督学习、位姿估计、深度重建
论文:Beyond Photometric Loss for Self-Supervised Ego-Motion Estimation
源码:https://github.com/hlzz/DeepMatchVO
年份:2019

二、端到端建图
1.单目相机实时连续三维建图:
关键词:单目相机、神经网络、TSDF、三维建图
论文:NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video
源码:https://github.com/zju3dv/NeuralRecon
年份:2021

2.半监督单目稠密重建:
关键词:半监督、稠密重建、单目
论文:MonoRec:Semi-Supervised Dense Reconstruction in Dynamic Environments from a Single Moving Camera
源码:https://github.com/Brummi/MonoRec
年份:2021

三、端到端定位导航
1.可变端到端定位与导航:
关键词:端到端、定位、导航
论文:Variational End-to-End Navigation and Localization
源码:-
年份:2019

四、特征匹配
1.基于深度学习特征提取的路标特征匹配:
关键词:深度学习、特征提取、特征匹配
论文:Improving Keypoint Matching Using a Landmark-Based Image Representation
源码:https://github.com/Hansry/Keypoint-Matching-Based-on-Landmark-Representation
年份:2019

2.基于深度学习的2D图像到3D点云的特征匹配:
关键词:深度学习、2D图像、3D点云、特征匹配
论文:2D3D-MatchNet: Learning to Match Keypoints Across 2D Image and 3D Point Cloud
源码:-
年份:2019

五、重定位
1.基于深度学习视觉位置识别的重定位:
关键词:卷积神经网络、路标定位网络、视觉位置识别
论文:Localizing Discriminative Visual Landmarks for Place Recognition
源码:-
年份:2019

2.基于迁移学习的视觉位置识别:
关键词:迁移学习、视觉位置识别
论文:A Multi-Domain Feature Learning Method for Visual Place Recognition
源码:
年份:2019

六、深度估计
1.基于深度学习的深度估计:
关键词:深度估计、深度学习
论文:Geo-Supervised Visual Depth Prediction
源码:https://github.com/feixh/GeoSup
年份:2019

七、语义理解
1.自动驾驶的实时语义推理:
关键词:街道分类、车辆识别、道路分割
论文:MultiNet: Real-time Joint Semantic Reasoning for Autonomous Driving
源码:https://github.com/MarvinTeichmann/MultiNet
年份:2018

2.实时语义分割网络:
关键词:跳跃结构、UNet、扩张前端
论文:SHUFFLESEG: REAL-TIME SEMANTIC SEGMENTATION NETWORK
源码:https://github.com/MSiam/TFSegmentation
年份:2018

3.基于自组织网络的点云语义解析:
关键词:自组织网络、点云特征提取、点云语义解析
论文:SO-Net: Self-Organizing Network for Point Cloud Analysis
源码:https://github.com/lijx10/SO-Net
年份:2018

八、语义SLAM
1.基于卷积神经网络的稠密三维语义建图:
关键词:语义建图、三维稠密、卷积神经网络
论文:SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks
源码:https://github.com/seaun163/semanticfusion
年份:2016

2.基于CNN语义融合的SLAM:
关键词:CNN、SLAM、语义融合
论文:CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction
源码:https://github.com/iitmcvg/CNN_SLAM
年份:2017

参考文献
[1] 张虎,机器人SLAM导航核心技术与实战[M]. 机械工业出版社,2022.

SLAM与AI的强强联合的更多相关文章
- Learning ROS for Robotics Programming - Second Edition(《ROS机器人编程学习-第二版》)
Learning ROS for Robotics Programming - Second Edition <ROS机器人编程学习-第二版> ----Your one-stop guid ...
- 目前大热的AI和SLAM的职业发展的想法
目前,AI的研究和SLAM的发展已经走到使用领域.还记得三年前,上<信息光学>的老师在课上提到,他有一个研究生买了一个两万块的笔记本,还要出国去研究人工智能,当时听着认为这位学长很疯狂.可 ...
- [SLAM] Studying Guidance
Books from Zhihu: 幽默一把 看完Gonzalez:嗯,好像很好玩的样子,我也来搞一搞.看完Price:什么鬼,怎么这么多公式,公式看不懂肿么破.看完Szeliski:原来用一千页的书 ...
- 光环国际联合阿里云推出“AI智客计划”
2018阿里巴巴云栖大会深圳峰会3月28日.29日在大中华喜来登酒店举行,阿里云全面展示智能城市.智能汽车.智能生活.智能制造等产业创新. 3月28日下午,以"深化产教融合,科技赋能育人才& ...
- SLAM+语音机器人DIY系列:(三)感知与大脑——5.机器人大脑嵌入式主板性能对比
摘要 在我的想象中机器人首先应该能自由的走来走去,然后应该能流利的与主人对话.朝着这个理想,我准备设计一个能自由行走,并且可以与人语音对话的机器人.实现的关键是让机器人能通过传感器感知周围环境,并通过 ...
- AI时代大点兵-国内外知名AI公司2018年最新盘点
AI时代大点兵-国内外知名AI公司2018年最新盘点 导言 据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家.美国占据1078家居首,中国以592家企业排名第二,其后分别是英国 ...
- 如何从零开始系统化学习视觉SLAM?
由于显示格式问题,建议阅读原文:如何从零开始系统化学习视觉SLAM? 什么是SLAM? SLAM是 Simultaneous Localization And Mapping的 英文首字母组合,一般翻 ...
- 【将门创投】AI 往期技术分享
计算机视觉 1. 嘉宾:商汤科技CEO 徐立 文章回顾:计算机视觉的完整链条,从成像到早期视觉再到识别理解 2. 嘉宾:格灵深瞳CTO 赵勇 文章回顾:计算机视觉在安防.交通.机器人.无人车等领域的应 ...
- 本人AI知识体系导航 - AI menu
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯 徐亦达老板 Dirichlet Process 学习 ...
- info AI drive
Who we look for Here at comma, we don't care about the source of your education or your traditional ...
随机推荐
- Solution Set -「AGC 013~015」C~F
目录 「AGC 013C」Ants on a Circle 「AGC 013D」Piling Up ^ 「AGC 013E」Placing Squares ^ 「AGC 013F」Two Faced ...
- 脱离实体类操作数据库(mysql版本)
原理很简单:1.利用mysql的information_schema库,获取对用表的信息: 2.使用DataSource,建立数据库连接,并执行sql脚本: 3.Map的keySet和values集合 ...
- OA系统的天数该怎样计算
文章首发:https://blog.liuzijian.com/post/oa-system-count-days.html 在开发一些OA系统的过程中,经常能遇到一个问题,就是时长计算,比如请假有请 ...
- Linux下mysql的二进制安装与部分练习
鲸英训练营 0531作业 一.单选题(每题5分,总分25分) 1. 在MySQL中,一般使用( A )语句来指定一个已有数据库作为当前工作数据库. A.USED B.USE C.BEGIN D.GO ...
- 在SOUI中将自定义配置信息写到布局文件中
SOUI的布局XML文件保存布局必须的信息.特定场合中,用户可能会需要在布局中指定业务需要处理的属性. 比如启程输入法的皮肤.有的皮肤支持高分屏,有的皮肤不支持.对于这个场景,比较理想的方案是直接在皮 ...
- 2021 OWASP TOP 10
OWASP TOP 10 2021年版Top 10有哪些变化? 2021年版Top 10产生了三个新类别,原有四个类别的命名和范围也发生了变化,且进行了一些 整合. 2017年 TOP 10 top ...
- Flink CDC全量和增量同步数据如何保证数据的一致性
Apache Flink 的 Change Data Capture (CDC) 功能主要用于实时捕获数据库中的变更记录,并将其转换为事件流以供下游处理.为了保证全量和增量数据同步时数据的一致性.不丢 ...
- spring的事务管理有几种方式实现
一.事务的4个特性: 原子性:一个事务中所有对数据库的操作是一个不可分割的操作序列,要么全做,要么全部做. 一致性:数据不会因为事务的执行而遭到破坏. 隔离性:一个事务的执行,不受其他事务 ...
- c/c++ 2019公司面试题目录
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/12131500.html c++面试题中经常被面试官面试的小问题总结(一)(本篇偏向基础知识) ...
- C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
前言 自从 DeepSeek 大模型火了以来,网络上出现了许多关于本地部署的教程和方法.然而,要真正深入了解其功能和应用,还是需要自己动手进行一次本地部署. DeepSeek 作为一个高效的自然语言处 ...