参考与前言

完整题目:PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving

Summary: 用learning做warm start,然后使用优化进行求解,对比速度上有7倍的提升

Type: IROS

Year: 2021

cite: 3

tag: planning

组织/Sensor: oxford, edinburgh

论文链接:https://arxiv.org/abs/2011.00509https://ieeexplore.ieee.org/abstract/document/9636862

代码链接:无

pre视频: https://www.youtube.com/watch?v=jK5oUhnJ7xw

同组同一批作者:TRO two-stage论文 主要基于这篇时间问题给出的一种方案;

1. Motivation

本文主要是想吸收这data-driven和model-based 各自优点,做到efficiency

问题场景

总结 motion planning 可以划分为两类:data-driven 和 model-based;inference in data-driven model对比与其他的传统搜索和优化算法通常也更有效;而model-based 具有更多可解释性,而这些以robustness和runtime为代价

Contribution

  1. A robust and scalable framework that imitates an expensive-to-run optimizer

  2. Applying this framework to the two-stage optimization based planner

    此点主要是速度上的提升,比上次转成MILP问题进行warm,快了7倍的时间

2. Method

提出:planning by imitation learning and optimization

  1. 使用模仿学习提取expert planner的行为,在线的,expert in the loop dataset augmentation(比如DAgger Dataset Aggregation 18)去持续的丰富整个训练集
  2. inference time 则是使用network做warm start,然后送到优化问题里进行求解

2.1 框架

2.2 网络设计

之所以直接进入了网络设计 是因为… 优化的部分在上一篇TRO2022 two-stage进行了详细说明,此部分主要就是如何让网络得到一个warm start以得到一个更为 高效的求解系统

网络框架:

loss设计,期望网络能输出以参考线为坐标轴的一系列轨迹,encoded成一系列向量 \(\rho^{\theta}=\left\{\left(x_{j}, y_{j}\right)\right\}_{j=1, \ldots, N} \in \mathbb{R}^{2 \times N} \text {. }\)loss则是他和expert轨迹的L2 norm,其中 \(\theta\) 为神经网络的参数,D为训练数据,\(\mu\)为正则化参数

\[\begin{equation*}{\mathcal{L}_\theta }(\mathcal{D}) = \frac{1}{{nN}}\sum\limits_{i \in \mathcal{D}} {{{\left\| {\rho _i^\theta - \rho _i^{\ast}} \right\|}^2}} + \mu ||\theta |{|^2}\tag{2}\end{equation*}
\]

2.3 Cost定义

其中和实验表里cost的定义为:

\[\begin{equation*}{\mathcal{J}_{2{\text{s}} - {\text{OPT}}}}\left( {{{\text{x}}_{1:N}},{{\text{u}}_{0:N - 1}}} \right) = \sum\limits_{k = 0}^N {\sum\limits_{\iota \in \mathcal{I}} {{\omega _\iota }} } {\theta _\iota }\left( {{{\text{x}}_k},{{\text{u}}_k}} \right)\tag{4}\end{equation*}
\]

w为权重,\(\theta\) 为速度,reference path,终点位置,控制量:加速度和转向 分别对应公式为: \(\omega_v, \omega_y, \omega_x, \omega_a, \omega_{δ}\) 权重经过了作者的调整

相关参数为如此表:

3. 实验及结果

可以看出对比之前2s-OPT来说在提高了速度的面前,仅一点点 求解质量的牺牲,同时对比MILP问题给的初解,虽然converged不比MILP问题,但是对比其他情况下已经是最高的了

None对应无论何时求解都讲车辆状态(包括位置,yaw,速度设为0);ConstVel, Accel, Decel 分别对应初始化时的状态为恒定速度,加速度、减速度等

4. Conclusion

现在就是意义上的做到了求解质量高,也可以达到实时性要求,其中主要和TRO 2s-OPT进行了联动对比(都是同一个作者走的,应该是同一个时间点 那个做完了就开始尝试,网络去学出给初解

在discussion部分,作者说未来的方向可以探索更高级的转接,使用initializations [33]以更小cost给出solution;同时看看其他的损失函数的加入,提高网络提供的初始化质量和弥补专家与优化器之间现有的差距(其实差距不大…)

碎碎念

JG说… 其实这种用神经网络给初解的想法很多,但是怎样给出这个expert很难,所以主要贡献其实还是在expert,或者主要效果还是由expert的好坏决定的


赠人点赞 手有余香 ;正向反馈 才能更好开放记录

【论文阅读】IROS2021: PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving的更多相关文章

  1. 论文阅读:Deep Attentive Tracking via Reciprocative Learning

    Deep Attentive Tracking via Reciprocative Learning 2018-11-14 13:30:36 Paper: https://arxiv.org/abs/ ...

  2. 【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning

    转载请注明出处:https://www.cnblogs.com/White-xzx/ 原文地址:https://arxiv.org/abs/1812.02425 Github: https://git ...

  3. 【CV论文阅读】An elegant solution for subspace learning

    Pre: It is MY first time to see quite elegant a solution to seek a subspace for a group of local fea ...

  4. 论文阅读 | BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain

    BadNets: 识别机器学习模型供应链中的漏洞 摘要 基于深度学习的技术已经在各种各样的识别和分类任务上取得了最先进的性能.然而,这些网络通常训练起来非常昂贵,需要在许多gpu上进行数周的计算;因此 ...

  5. [置顶] 人工智能(深度学习)加速芯片论文阅读笔记 (已添加ISSCC17,FPGA17...ISCA17...)

    这是一个导读,可以快速找到我记录的关于人工智能(深度学习)加速芯片论文阅读笔记. ISSCC 2017 Session14 Deep Learning Processors: ISSCC 2017关于 ...

  6. 【论文阅读】Learning Dual Convolutional Neural Networks for Low-Level Vision

    论文阅读([CVPR2018]Jinshan Pan - Learning Dual Convolutional Neural Networks for Low-Level Vision) 本文针对低 ...

  7. 论文阅读:《Bag of Tricks for Efficient Text Classification》

    论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...

  8. 【论文阅读】PRM-RL Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning

    目录 摘要部分: I. Introduction II. Related Work III. Method **IMPORTANT PART A. RL agent training [第一步] B. ...

  9. 【论文阅读】Motion Planning through policy search

    想着CSDN还是不适合做论文类的笔记,那里就当做技术/系统笔记区,博客园就专心搞看论文的笔记和一些想法好了,[]以后中框号中间的都算作是自己的内心OS 有时候可能是问题,有时候可能是自问自答,毕竟是笔 ...

  10. [论文阅读] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications (MobileNet)

    论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 本文提出的模型叫Mobi ...

随机推荐

  1. 【爬虫实战】用python爬今日头条热榜TOP50榜单!

    目录 一.爬取目标 二.爬取结果 三.代码讲解 四.技术总结 五.演示视频 六.附完整源码 一.爬取目标 您好!我是@马哥python说,一名10年程序猿. 今天分享一期爬虫案例,爬取的目标是:今日头 ...

  2. 在Deepin 20.2系统中换源并全新图解安装MySQL数据库

    在Deepin 20.2系统中换源并全新图解安装MySQL数据库 https://www.ywnz.com/linuxysjk/9249.html ubuntu下apt-get彻底卸载mysql 删除 ...

  3. cesium教程9-加载倾斜摄影并解决高度问题

    无人机航拍的倾斜摄影,用照片和视频处理生成三维模型,一般照片都带有坐标信息,所以一般都能定位的比较准确,但是经常会出现高度偏差,这个时候就需要特殊处理了. 今天航拍建模的效果如下: 这个建模没有裁剪, ...

  4. 关于文心一言不能打开F12开发者工具

    直接被JS写死的debugger关键字下了断点.行吧,不让调试就不让调试吧,关闭开发者工具之后,直接跳到了空白页. 开发者工具Ctrl+F8可以禁用断点调试 点击查看代码 <!DOCTYPE h ...

  5. JDK源码阅读-------自学笔记(十七)(java.io.File类)

    File类简介 java.io.File类:抽象代表文件和目录. 使用此类,相当于获取了系统的文件,可以对其进行操作. 在开发中,读取文件.生成文件.删除文件.修改文件的属性时经常会用到本类 File ...

  6. PageOffice 6 最简集成代码(VUE+Springboot)

    本文描述了PageOffice产品在(VUE+Springboot)前后端分离的项目中如何集成调用.调用PageOffice打开文件的主要核心代码是:后端Springboot项目中第6步和前端VUE项 ...

  7. C# 炸弹人 winform版

    实现这个游戏的基本功能包含几个对象:玩家,怪物,墙砖,炸弹,通关的门.玩家通过上下左右方向键移动,放置炸弹,被怪物杀死,被炸弹炸死.怪物随机方向移动,能杀死玩家.炸弹有爆炸功能,炸弹的火花长度.通过的 ...

  8. RocketMQ阅读源码前的准备

    本文将讲解如何在IDEA中导入 RocketMQ 源码,并运行 Broker 和 NameServer,编写一个消息发送与消息消费的示例. 一. 源码导入及调试 1.1 导入源码 RocketMQ 原 ...

  9. golang 怎样防止结构体对象被拷贝

    主要实现Lock以及Unlock就可以了 此时使用go vet mian.go 检查就会提示我们./main1.go:25:7: assignment copies lock value to b: ...

  10. iOS符号表手工还原

    1.通过Xcode的Device工具导出app.crash文件 2.将.crash 和 .dSYM符号 app放在同一个目录中 3.寻找symbolicatecrash,将symbolicatecra ...