参考与前言

完整题目：PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving

Summary: 用learning做warm start，然后使用优化进行求解，对比速度上有7倍的提升

Type: IROS

Year: 2021

cite: 3

tag: planning

组织/Sensor: oxford, edinburgh

论文链接：https://arxiv.org/abs/2011.00509；https://ieeexplore.ieee.org/abstract/document/9636862

代码链接：无

pre视频: https://www.youtube.com/watch?v=jK5oUhnJ7xw

同组同一批作者：TRO two-stage论文主要基于这篇时间问题给出的一种方案；

1. Motivation

本文主要是想吸收这data-driven和model-based 各自优点，做到efficiency

问题场景

总结 motion planning 可以划分为两类：data-driven 和 model-based；inference in data-driven model对比与其他的传统搜索和优化算法通常也更有效；而model-based 具有更多可解释性，而这些以robustness和runtime为代价

Contribution

A robust and scalable framework that imitates an expensive-to-run optimizer
Applying this framework to the two-stage optimization based planner

此点主要是速度上的提升，比上次转成MILP问题进行warm，快了7倍的时间

2. Method

提出：planning by imitation learning and optimization

使用模仿学习提取expert planner的行为，在线的，expert in the loop dataset augmentation（比如DAgger Dataset Aggregation 18）去持续的丰富整个训练集
inference time 则是使用network做warm start，然后送到优化问题里进行求解

2.1 框架

2.2 网络设计

之所以直接进入了网络设计是因为… 优化的部分在上一篇TRO2022 two-stage进行了详细说明，此部分主要就是如何让网络得到一个warm start以得到一个更为高效的求解系统

网络框架：

loss设计，期望网络能输出以参考线为坐标轴的一系列轨迹，encoded成一系列向量 \(\rho^{\theta}=\left\{\left(x_{j}, y_{j}\right)\right\}_{j=1, \ldots, N} \in \mathbb{R}^{2 \times N} \text {. }\)loss则是他和expert轨迹的L2 norm，其中 \(\theta\) 为神经网络的参数，D为训练数据，\(\mu\)为正则化参数

\[\begin{equation*}{\mathcal{L}_\theta }(\mathcal{D}) = \frac{1}{{nN}}\sum\limits_{i \in \mathcal{D}} {{{\left\| {\rho _i^\theta - \rho _i^{\ast}} \right\|}^2}} + \mu ||\theta |{|^2}\tag{2}\end{equation*}
\]

2.3 Cost定义

其中和实验表里cost的定义为：

\[\begin{equation*}{\mathcal{J}_{2{\text{s}} - {\text{OPT}}}}\left( {{{\text{x}}_{1:N}},{{\text{u}}_{0:N - 1}}} \right) = \sum\limits_{k = 0}^N {\sum\limits_{\iota \in \mathcal{I}} {{\omega _\iota }} } {\theta _\iota }\left( {{{\text{x}}_k},{{\text{u}}_k}} \right)\tag{4}\end{equation*}
\]

w为权重，\(\theta\) 为速度，reference path，终点位置，控制量：加速度和转向分别对应公式为： \(\omega_v, \omega_y, \omega_x, \omega_a, \omega_{δ}\) 权重经过了作者的调整

3. 实验及结果

可以看出对比之前2s-OPT来说在提高了速度的面前，仅一点点求解质量的牺牲，同时对比MILP问题给的初解，虽然converged不比MILP问题，但是对比其他情况下已经是最高的了

None对应无论何时求解都讲车辆状态（包括位置，yaw，速度设为0）；ConstVel, Accel, Decel 分别对应初始化时的状态为恒定速度，加速度、减速度等

4. Conclusion

现在就是意义上的做到了求解质量高，也可以达到实时性要求，其中主要和TRO 2s-OPT进行了联动对比（都是同一个作者走的，应该是同一个时间点那个做完了就开始尝试，网络去学出给初解

在discussion部分，作者说未来的方向可以探索更高级的转接，使用initializations [33]以更小cost给出solution；同时看看其他的损失函数的加入，提高网络提供的初始化质量和弥补专家与优化器之间现有的差距（其实差距不大…）

碎碎念

JG说… 其实这种用神经网络给初解的想法很多，但是怎样给出这个expert很难，所以主要贡献其实还是在expert，或者主要效果还是由expert的好坏决定的

赠人点赞手有余香；正向反馈才能更好开放记录

【论文阅读】IROS2021: PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving的更多相关文章

论文阅读：Deep Attentive Tracking via Reciprocative Learning
Deep Attentive Tracking via Reciprocative Learning 2018-11-14 13:30:36 Paper: https://arxiv.org/abs/ ...
【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning
转载请注明出处:https://www.cnblogs.com/White-xzx/ 原文地址:https://arxiv.org/abs/1812.02425 Github: https://git ...
【CV论文阅读】An elegant solution for subspace learning
Pre: It is MY first time to see quite elegant a solution to seek a subspace for a group of local fea ...
论文阅读 | BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain
BadNets: 识别机器学习模型供应链中的漏洞摘要基于深度学习的技术已经在各种各样的识别和分类任务上取得了最先进的性能.然而,这些网络通常训练起来非常昂贵,需要在许多gpu上进行数周的计算;因此 ...
[置顶] 人工智能（深度学习）加速芯片论文阅读笔记（已添加ISSCC17，FPGA17...ISCA17...）
这是一个导读,可以快速找到我记录的关于人工智能(深度学习)加速芯片论文阅读笔记. ISSCC 2017 Session14 Deep Learning Processors: ISSCC 2017关于 ...
【论文阅读】Learning Dual Convolutional Neural Networks for Low-Level Vision
论文阅读([CVPR2018]Jinshan Pan - Learning Dual Convolutional Neural Networks for Low-Level Vision) 本文针对低 ...
论文阅读：《Bag of Tricks for Efficient Text Classification》
论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...
【论文阅读】PRM-RL Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning
目录摘要部分: I. Introduction II. Related Work III. Method **IMPORTANT PART A. RL agent training [第一步] B. ...
【论文阅读】Motion Planning through policy search
想着CSDN还是不适合做论文类的笔记,那里就当做技术/系统笔记区,博客园就专心搞看论文的笔记和一些想法好了,[]以后中框号中间的都算作是自己的内心OS 有时候可能是问题,有时候可能是自问自答,毕竟是笔 ...
[论文阅读] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications (MobileNet)
论文地址:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 本文提出的模型叫Mobi ...

随机推荐

python3解析FreeSWITCH会议室列表信息
操作系统 :CentOS 7.6_x64 FreeSWITCH版本 :1.10.9 Python版本:3.9.12 进行FreeSWITCH会议室相关功能开发过程中,会遇到需要解析会议室列表信息并进行 ...
SAP集成技术（十三）SAP Cloud Integration
异构应用环境给IT带来了各种问题.在这种情况下,混合集成环境尤其受到影响.同时,对于建立在混合IT环境上的数字化转型项目,数据集成和跨系统访问已经开始发挥核心作用.为了满足不断增长的需求,SAP Bu ...
C#/C++ 通过ODBC连接OceanBase Oracle租户
概述近期我们项目正处于将Oracle数据库迁移到OceanBase Oracle租户模式的阶段.考虑到我们项目采用了C++和C#混合开发,并且使用了多种技术,因此存在多种数据库连接方式.然而,针对C ...
ERROR: Error installing mysql2: ERROR: Failed to build gem native extension [@Ubuntu 15.04]
参考文章: https://blog.csdn.net/a60919820/article/details/101847890 安装mysql 参考:https://www.cnblogs.com/h ...
Golang重复Rails Devise gem密码加密
https://github.com/haimait/go-devise-encryptor package main import ( "fmt" //devisecrypto ...
ansible(17)--ansible的archive和unarchive模块
1. archive模块功能:在远端主机打包与压缩: 主要参数如下: 参数说明 path 要压缩的文件或目录 dest 压缩后的文件 format 指定打包压缩的类型:bz2.gz.tar.xz. ...
python教程1.2：变量+数据类型+运算符
一.变量程序是从上到下依次逐⾏执⾏的,所以变量必须先定义,后调⽤, 否则会报错变量定义规范二.数据类型 1.数字类型可⽤ type() ⽅法来查看数据类型 2.字符串多引号多引号什么作 ...
Python基础篇（流程控制）
流程控制是程序运行的基础,流程控制决定了程序按照什么样的方式执行. 条件语句条件语句一般用来判断给定的条件是否成立,根据结果来执行不同的代码,也就是说,有了条件语句,才可以根据不同的情况做不同的事, ...
内网渗透 Metasploit(MSF)基础使用
免责申明以下内容仅供学习使用,非法使用造成的问题由使用人承担攻击思路漏洞探测(信息收集) <- fsacn,namp | 漏洞利用 <- 工具(msf等) | 获取服务器权限 MSF ...
Unicode 14 标准发布
本文为翻译,原文地址Unicode 博客: 宣布 Unicode 标准, 版本 14.0 Unicode 标准版本 14.0 现已可用,包括核心规范.附件和数据文件.此版本增加了 838 个字符,总共 ...

【论文阅读】IROS2021: PILOT: Efficient Planning by Imitation Learning and Optimisation for Safe Autonomous Driving