点击"计算机视觉life"关注,置顶更快接收消息! 本文由作者刘骁授权发布,转载请联系原作者,个人主页http://www.liuxiao.org 目前 Semantic SLAM (注意不是 Semantic Mapping)工作还比较初步,可能很多思路还没有打开,但可以预见未来几年工作会越来越多.语义 SLAM 的难点在于怎样设计误差函数,将 Deep Learning 的检测或者分割结果作为一个观测,融入 SLAM 的优化问题中一起联合优化,同时还要尽可能做到至少 GPU 实时.
最近一直在考虑语义slam在自动驾驶和辅助驾驶中的用法,研究了一下视觉为主的高精度地图+高精定位的模式,特别是mobileye的REM. 秉承先建图再定位的思路,在服务器端(云端)建图,在车端定位. 视觉高精度定位依赖于目标检测算法的精度和泛化能力. 视觉高精度地图的适应性还是不足,无法在在照明不足的夜晚和恶劣天气发挥作用.限定场景下也许可行. 数据关联怎么做还不是很确定,特别是在没有先验信息(如GPS)的情况下做重定位.Probabilistic Data Association for Se
本文试图概括Semantic SLAM的主要思路和近年工作,⻓期更新.但因水平有限,若有错漏,感谢指正. (更好的公式显示效果,可关注文章底部的公众号) Semantic SLAM 简介 至今为止,主流的 SLAM 方案 [1] 基于处于像素层级的特征点,更具体地,它们往往只能用角点或边缘来提取路标.人类是通过物体在图像中的运动来推测相机的运动,而非特定像素点. Semantic SLAM 是研究者试图利用物体信息的方案,其在Deep Learning的推动下有了较大的发展,成为了相对独立的分支
多目标模型 这部分想讲一下Semantic Localization Via the Matrix Permanent这篇文章的多目标测量概率模型.考虑到实际情况中,目标检测算法从单张图像中可能检测出若干类物体,每一类物体可能都有好几个实例.当我们尝试建立数据关联时,先从简单的情形入手,再推广到一般情形.下面假设检测结果共有\(m\)个. 所有的检测都是误检测 当目标位置\(x\)的视场内并没有可检测的目标存在时,即\(Y_d(x)=\varnothing\).那么,所有的测量都是误检测.根据假