【论文阅读】IROS2021: PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving
参考与前言
完整题目:PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving
Summary: 用learning做warm start,然后使用优化进行求解,对比速度上有7倍的提升
Type: IROS
Year: 2021
cite: 3
tag: planning
组织/Sensor: oxford, edinburgh
论文链接:https://arxiv.org/abs/2011.00509;https://ieeexplore.ieee.org/abstract/document/9636862
代码链接:无
pre视频: https://www.youtube.com/watch?v=jK5oUhnJ7xw
同组同一批作者:TRO two-stage论文 主要基于这篇时间问题给出的一种方案;
- 博客园 TRO2022: A Two-Stage Optimization-Based Motion Planner for Safe Urban Driving
- CSDN TRO2022: A Two-Stage Optimization-Based Motion Planner for Safe Urban Driving
1. Motivation
本文主要是想吸收这data-driven和model-based 各自优点,做到efficiency
问题场景
总结 motion planning 可以划分为两类:data-driven 和 model-based;inference in data-driven model对比与其他的传统搜索和优化算法通常也更有效;而model-based 具有更多可解释性,而这些以robustness和runtime为代价
Contribution
A robust and scalable framework that imitates an expensive-to-run optimizer
Applying this framework to the two-stage optimization based planner
此点主要是速度上的提升,比上次转成MILP问题进行warm,快了7倍的时间
2. Method
提出:planning by imitation learning and optimization
- 使用模仿学习提取expert planner的行为,在线的,expert in the loop dataset augmentation(比如DAgger Dataset Aggregation 18)去持续的丰富整个训练集
- inference time 则是使用network做warm start,然后送到优化问题里进行求解
2.1 框架


2.2 网络设计
之所以直接进入了网络设计 是因为… 优化的部分在上一篇TRO2022 two-stage进行了详细说明,此部分主要就是如何让网络得到一个warm start以得到一个更为 高效的求解系统
网络框架:

loss设计,期望网络能输出以参考线为坐标轴的一系列轨迹,encoded成一系列向量 \(\rho^{\theta}=\left\{\left(x_{j}, y_{j}\right)\right\}_{j=1, \ldots, N} \in \mathbb{R}^{2 \times N} \text {. }\)loss则是他和expert轨迹的L2 norm,其中 \(\theta\) 为神经网络的参数,D为训练数据,\(\mu\)为正则化参数
\]
2.3 Cost定义
其中和实验表里cost的定义为:
\]
w为权重,\(\theta\) 为速度,reference path,终点位置,控制量:加速度和转向 分别对应公式为: \(\omega_v, \omega_y, \omega_x, \omega_a, \omega_{δ}\) 权重经过了作者的调整
相关参数为如此表:

3. 实验及结果


可以看出对比之前2s-OPT来说在提高了速度的面前,仅一点点 求解质量的牺牲,同时对比MILP问题给的初解,虽然converged不比MILP问题,但是对比其他情况下已经是最高的了
None对应无论何时求解都讲车辆状态(包括位置,yaw,速度设为0);ConstVel, Accel, Decel 分别对应初始化时的状态为恒定速度,加速度、减速度等
4. Conclusion
现在就是意义上的做到了求解质量高,也可以达到实时性要求,其中主要和TRO 2s-OPT进行了联动对比(都是同一个作者走的,应该是同一个时间点 那个做完了就开始尝试,网络去学出给初解
在discussion部分,作者说未来的方向可以探索更高级的转接,使用initializations [33]以更小cost给出solution;同时看看其他的损失函数的加入,提高网络提供的初始化质量和弥补专家与优化器之间现有的差距(其实差距不大…)
碎碎念
JG说… 其实这种用神经网络给初解的想法很多,但是怎样给出这个expert很难,所以主要贡献其实还是在expert,或者主要效果还是由expert的好坏决定的
赠人点赞 手有余香 ;正向反馈 才能更好开放记录
【论文阅读】IROS2021: PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving的更多相关文章
- 论文阅读:Deep Attentive Tracking via Reciprocative Learning
Deep Attentive Tracking via Reciprocative Learning 2018-11-14 13:30:36 Paper: https://arxiv.org/abs/ ...
- 【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning
转载请注明出处:https://www.cnblogs.com/White-xzx/ 原文地址:https://arxiv.org/abs/1812.02425 Github: https://git ...
- 【CV论文阅读】An elegant solution for subspace learning
Pre: It is MY first time to see quite elegant a solution to seek a subspace for a group of local fea ...
- 论文阅读 | BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain
BadNets: 识别机器学习模型供应链中的漏洞 摘要 基于深度学习的技术已经在各种各样的识别和分类任务上取得了最先进的性能.然而,这些网络通常训练起来非常昂贵,需要在许多gpu上进行数周的计算;因此 ...
- [置顶]
人工智能(深度学习)加速芯片论文阅读笔记 (已添加ISSCC17,FPGA17...ISCA17...)
这是一个导读,可以快速找到我记录的关于人工智能(深度学习)加速芯片论文阅读笔记. ISSCC 2017 Session14 Deep Learning Processors: ISSCC 2017关于 ...
- 【论文阅读】Learning Dual Convolutional Neural Networks for Low-Level Vision
论文阅读([CVPR2018]Jinshan Pan - Learning Dual Convolutional Neural Networks for Low-Level Vision) 本文针对低 ...
- 论文阅读:《Bag of Tricks for Efficient Text Classification》
论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...
- 【论文阅读】PRM-RL Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning
目录 摘要部分: I. Introduction II. Related Work III. Method **IMPORTANT PART A. RL agent training [第一步] B. ...
- 【论文阅读】Motion Planning through policy search
想着CSDN还是不适合做论文类的笔记,那里就当做技术/系统笔记区,博客园就专心搞看论文的笔记和一些想法好了,[]以后中框号中间的都算作是自己的内心OS 有时候可能是问题,有时候可能是自问自答,毕竟是笔 ...
- [论文阅读] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications (MobileNet)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 本文提出的模型叫Mobi ...
随机推荐
- 三、Doris数据模型
DorisDB根据摄入数据和实际存储数据之间的映射关系, 将数据表的明细表, 聚合表和更新表, 分别对应有明细模型, 聚合模型和更新模型. Aggregate (聚合模型) : 将表中的列分为了Key ...
- AI实战 | 手把手带你打造智能待办助手
背景 大家好,我是努力的小雨.今天我想分享一下搭建待办助手的经历.起初,我并没有什么特别的创意点子.但在4月16日的百度Create大会上,我看到了小度的大模型加持使得其变得更加智能.我被一场示例所震 ...
- 01、Windows 排查
Windows 分析排查 分析排查是指对 Windows 系统中的文件.进程.系统信息.日志记录等进行检测,挖掘 Windows 系统中是否具有异常情况 1.开机启动项检查 一般情况下,各种木马.病毒 ...
- WEB服务与NGINX(11)-NGINX状态页
nginx状态页 nginx的状态页功能用于输出nginx的基本状态信息,基于ngx_http_stub_status_module模块实现. 默认情况下不生成此模块,应使用--with-http_s ...
- JDK源码阅读-------自学笔记(七)(二维数组的浅析)
实际开发中一般最多使用到二维数组,再高很少使用 二维数组很少用,实际开发中会使用容器代替使用 1.创建二维数组 1 // 二维数组初始化 2 int[][] secondDimensional = n ...
- prometheus使用2
参考不错的 Prometheus监控实战之node_exporter详解: https://blog.csdn.net/ygq13572549874/article/details/129115350 ...
- .net core DataTable.Load()方法,返回的行缺少,少于reader读出的行
我分析的原因是,datatable模式的schema默认是根据查询的sql来的.起因是我写的sql中带有主键的列,查出来有很多重复值, 然后dt.load会默认把主键重复的行给合并掉,所以最终查询出来 ...
- Python并行运算——threading库详解(持续更新)
0. 写在前面:进程和线程 博文参考: Python的并行(持续更新)_python 并行-CSDN博客 <Python并行编程 中文版> 一些相关概念请见上一篇博文. 1. 在Pytho ...
- RTOS官方文档学习
任务与协程 区别 一个程序可以只有任务.只有协程.二者都有,但不可以通过队列/信号量互相传递数据 任务特点 任务之间可以互相独立 每个任务分配自己的堆栈,提高了RAM使用率 操作简单.按优先级抢占式执 ...
- 国产大语言模型ChatGLM3本地搭建、使用和功能扩展
1.官网 ChatGLM3 2.下载ChatGLM3源码 直接在https://github.com/THUDM/ChatGLM3,下载源码 3.下载模型 如果显卡8G一下建议下载ChatGLM3-6 ...