状态估计和KalmanFilter公式的推导与应用
状态估计的概率解释
运动和观测方程:
\begin{array}{l}
x_k = f(x_{k_1}, u_k) + w_k \\
z_k = h(y_j, x_k) + v_{k,j}
\end{array}
\right. \qquad {k = 1,\dots,N, j = 1,\dots,M}
\tag{1.1}
\]
其中,各个参数的含义如下:
\(x_k\) :机器人的位姿。
\(u_k\) :系统在k时刻的输入量。
\(w_k\):位姿变化的随机噪声。
\(z_k\) :系统的观测值,传感器采集的观测数据。
\(y_j\) :路标,或者说是观测点。
\(v_{k,j}\):观测过程中的随机噪声。
我们的目标则是利用系统在k时刻的输入量\(u_k\)和系统的观测量\(z_k\),估计机器的位姿\(x_k\)和路标点\(y_j\)的概率分布。
在比较常见且合理的情况下,我们可以假设状态量和噪声项服从高斯分布——这意味这我们在程序中只需要存储他们的均值和协方差矩阵即可。均值可以看作变量的最最优估计,协方差则可以度量变量的不确定性。
由于位姿\(x_k\)和路标点\(y_j\)都是需要我们估计的变量,这里我们改变符号的意义。令\(x_k\)为k时刻所有的未知量,记作:
\tag{1.2}
\]
根据上述(1.1)和(1.2)可以将运动方程和观测方程写成如下形式:
\begin{array}{l}
x_k = f(x_{k_1}, u_k) + w_k \\
z_k = h(x_k) + v_{k,j}
\end{array}
\right. \qquad {k = 1,\dots,N}
\tag{1.3}
\]
现在考虑第k时刻的情况,我们希望使用过去0到时刻的数据来估计现在的状态分布:
\tag{1.4}
\]
根据贝叶斯公式,可以得到如下公式:
\propto
P(z_k|x_k) P(x_k|x_0,u_{1:k}, z_{1:k-1})
\tag{1.5}
\]
这里的第一项称为似然,第二项称为先验。似然由观测方程给定,而先验部分,\(x_k\)是基于过去所有状态估计而来的。至少,它会受到\(x_{k-1}\)的影响,于是我们以\(x_{k-1}\)时刻为条件概率展开:
\int
P(x_k|x_{k-1},x_0, u_{1:k}, z_{1:k-1})
P(x_{k-1}|x_0,u_{1:k}, z_{1:k-1}) dx_{k-1}
\tag{1.6}
\]
对于后续的操作,有很多的方法。
其中一种方法就是假设马尔可夫性。
一阶马尔可夫性: k时刻的状态只和k-1时刻的状态有关,而与再之前的无关。
如果这样假设,我们得到的是以扩展卡尔曼滤波(EKF)为代表的滤波器方法。
另一种方法是依然考虑k时刻和之前所有状态的关系,此时得到的是非线性优化为主体的优化框架。
在这里,我们先了解卡尔曼滤波的原理和应用。
线性系统和卡尔曼滤波
根据上文,我们假设了这个系统符合马尔可夫性,我们可以对公式(1.6)做出一些简化。
公式右侧第一部分可以简化成如下形式:
\[P(x_k|x_{k-1},x_0, u_{1:k}, z_{1:k-1}) =
P(x_k|x_{k-1}, u_{1:k})
\tag{2.1}
\]公式右侧第二部分:(已知k时刻只和k-1时刻的状态相关)
\[P(x_{k-1}|x_0,u_{1:k}, z_{1:k-1}) =
P(x_{k-1}|x_0,u_{1:k-1}, z_{1:k-1})
\tag{2.2}
\]
观察上述公式,我们可以知道,我们实际上在做“如何把k-1时刻的状态分布推导至k时刻”这一件事请。
我们假设状态量服从高斯分布,从最简单的线性高斯系统开始,得到如下公式:
\begin{array}{l}
x_k = A_kx_{k-1} + u_k + w_k \\
z_k = C_kx_k + v_{k,j}
\end{array}
\right. \qquad {k = 1,\dots,N}
\tag{2.3}
\]
假设所有的状态和噪声都符合高斯分布,这里的噪声可以记作:(这里省略了R和Q的下标)
v_k \sim N(0, Q)
\tag{2.4}
\]
利用马尔可夫性,假设我们已知k-1时刻的状态,也就是k-1时刻的后验状态估计\(\hat{x}_{k-1}\)及其协方差\(\hat{P}_{k-1}\),现在要根据k时刻的输入,确认\(x_k\)的后验。
这里我们使用\(\hat{x}_{k}\)表示后验分布,使用\(\tilde{x}_k\)表示先验分布。
卡尔曼滤波第一步: 通过运动方程确认\(x_k\)的先验分布。这一步是线性的,高斯分布的线性变换依然是高斯分布,所以可以得到如下公式:
N(A_k\hat{x}_{k-1} + u_k, A_k\hat{P}_{k-1}A^T_k + R)
\tag{2.5}
\]
这里协方差的推导可以参考《概率论与数理统计》的P112页,关于n维正态随机变量的协方差矩阵。
这一步称为预测。可以记作:
\tilde{P}_k = A_k\hat{P}_{k-1}A^T_k + R
\tag{2.6}
\]
卡尔曼滤波第二步: 根据观测方程,我们可以计算莫格时刻应该产生怎样的观测数据:
\tag{2.7}
\]
我们已经假设状态量符合高斯分布,根据贝叶斯公式,可以得到如下公式:
\eta
N(C_kx_k, Q) \cdot
N(\tilde{x}_k, \tilde{P}_k)
\tag{2.8}
\]
两侧都是高斯分布,我们带入高斯分布的公式,只需要保证指数部分相同,无需理会前面的因子部分。可以得到如下公式:
{(z_k -C_kx_k)}^T \hat{Q}^{-1}_k (z_k - C_kx_k) +
{(x_k - \tilde{x}_k)^T} {\tilde{P}^{-1}_{k}} (x_k - \tilde{x}_k)
\tag{2.9}
\]
我们需要根据上述这个公式推导出\(\hat{x}_k\)和\(\hat{P}_k\)。
这里是通过系数相等进行了化简,我在这里简写一下:
\begin{array}{l}
\hat{P}^{-1}_k =
C^T_kQ^{-1}C_k + \tilde{P}^{-1}_k
\\ \\
-2\hat{x}^T_k\hat{P}^{-1}_kx_k =
-2z^T_k Q^{-1}C_kx_k - 2\tilde{x}^T_k\tilde{P}^{-1}_kx_k
\end{array}
\right.
\tag{2.10}
\]
我们记作\(K = \hat{P}_kC^T_kQ^{-1}\)得到如下公式:
\begin{array}{l}
\hat{P}_k =(I - KC_k) \tilde{P}_k
\\ \\
\hat{x}_k = \tilde{x}_k + K(z_k - C_k \hat{x}_k)
\end{array}
\right.
\tag{2.11}
\]
这个部称为更新。
总结kalmanFilter的用法
预测
\[\tilde{x}_k = A_k\hat{x}_{k-1} + u_k, \quad
\tilde{P}_k = A_k\hat{P}_{k-1}A^T_k + R
\tag{2.12}
\]更新:先计算K(卡尔曼增益), 然后更新后验概率的分布。
\[\begin{array}{l}
K = \hat{P}_kC^T_k(C_k\tilde{P}_kC^T_k + Q_k)^{-1}
\\ \\
\hat{P}_k =(I - KC_k) \tilde{P}_k
\\ \\
\hat{x}_k = \tilde{x}_k + K(z_k - C_k \hat{x}_k)
\end{array}
\tag{2.13}
\]
状态估计和KalmanFilter公式的推导与应用的更多相关文章
- kalman滤波器公式的推导
卡尔曼滤波的使用范围: 该系统要有如下关系: 计算步骤: PART0:INI PART1:Time update 迭代的目标:从X(K-1)+ 求得X(K) + 因此,先有X(K-1)+,已知F,G. ...
- 【知识总结】卡特兰数 (Catalan Number) 公式的推导
卡特兰数的英文维基讲得非常全面,强烈建议阅读! Catalan number - Wikipedia (本文中图片也来源于这个页面) 由于本人太菜,这里只选取其中两个公式进行总结. (似乎就是这两个比 ...
- Batch Normalization 反向传播(backpropagation )公式的推导
What does the gradient flowing through batch normalization looks like ? 反向传播梯度下降权值参数更新公式的推导全依赖于复合函数求 ...
- 蔡勒(Zeller)公式及其推导:快速将任意日期转换为星期数
0. 本文的初衷及蔡勒公式的用处 前一段时间,我在准备北邮计算机考研复试的时候,做了几道与日期计算相关的题目,在这个过程中我接触到了蔡勒公式.先简单的介绍一下蔡勒公式是干什么用的. 我们有时候会遇到这 ...
- 回顾Games101图形学(一)几何变换中一些公式的推导
回顾Games101 chatper1 - 6 前言 本文只写回顾后重新加深认识的知识 透视除法的意义 经过MVP矩阵之后,将模型空间下某点的坐标,转换成了裁剪空间下的坐标,此时因为裁剪空间的范围是x ...
- SVM公式详尽推导,没有思维跳跃。
假定数据集\(T=\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\},x_n \in R_k, y_n \in \{1,-1\}\)线性可分,SVM的优化目标是: 优化一个超平 ...
- Android -- 贝塞尔曲线公式的推导
1,最近看了几个不错的自定义view,发现里面都会涉及到贝塞尔曲线知识,深刻的了解到贝塞尔曲线是进阶自定义view的一座大山,so,今天先和大家来了解了解. 2,贝塞尔曲线作用十分广泛,简单举几个的栗 ...
- Android -- 贝塞尔曲线公式的推导和简单使用
1,最近看了几个不错的自定义view,发现里面都会涉及到贝塞尔曲线知识,深刻的了解到贝塞尔曲线是进阶自定义view的一座大山,so,今天先和大家来了解了解. 2,贝塞尔曲线作用十分广泛,简单举几个的栗 ...
- Logistic回归算法梯度公式的推导
最近学习Logistic回归算法,在网上看了许多博文,笔者觉得这篇文章http://blog.kamidox.com/logistic-regression.html写得最好.但其中有个关键问题没有讲 ...
随机推荐
- Excel 运算符(三):文本连接符
文本连接符&用来合并文本串.比如,连接"计算机"和"基础"两个文本串:"计算机基础"&"基础",最终结果 ...
- Python小游戏——外星人入侵(保姆级教程)第一章 01创建Pygame窗口 02创建设置类Setting()
系列文章目录 第一章:武装飞船 01:创建Pygame窗口以及响应用户输入 02:创建设置类Setting() 一.前期准备 1.语言版本 Python3.9.0 2.编译器 Pycharm2022 ...
- IDEA:库源与类的字节码不匹配
在我配置pom.xml文件后,进行代码编辑,发现引入的方法并不是想要的内容,然后我就进入下载源码后进入到源码中发现我想要的方法和导入的jar包内的源码方法并不相同 ,于是到jar的存放地址中将其他版本 ...
- java方法---可变参数
可变参数 在方法的声明中,在指定参数类型后面加一个...(省略号) 一个方法中只能指定一个可变参数,它必须是方法的最后一个参数,任何普通参数必须在它之前声明:
- 1.4_HTML的标签简介
HTML 标签 HTML 标记标签通常被称为 HTML 标签 (HTML tag). HTML 标签是由尖括号包围的关键词,比如 <html> HTML 标签通常是成对!出现的,比如 &l ...
- iOS 集成WebRTC相关知识点总结
前言 本文主要是整理了使用WebRTC做音视频通讯时的各知识点及问题点.有理解不足和不到位的地方也欢迎指正. 对于你感兴趣的部分可以选择性观看. WebRTC的初始化 在使用WebRTC的库之前,需要 ...
- CF-1675D. Vertical Paths
题意:每次可以选择一条路径,要求这条路径中每个点都是上一个点的子节点,求最少需要几条路径将所有点走完 思路:将每个点有没有子节点判断出来,因为只有没有子节点的点需要新增一条路,所以需要路径的最小数目就 ...
- IO_对象流
对象流 对象的本质是用来组织和存储数据的,对象本身也是数据.那么,能不能将对象存储到硬盘上的文件中呢?能不能将对象通过网络传输到另一个电脑呢?我们可以通过序列化和反序列化实现. java对象的序列化和 ...
- 【微服务】- 配置中心 - Nacos
微服务 - 配置中心 - Nacos 一个有梦有戏的人 @怒放吧德德 分享学习心得,欢迎指正,大家一起学习成长! 今天的学习任务就是学习使用Nacos作为配置中心. 努力克制自己,拒绝摆烂! 什么是配 ...
- Elasticsearch:top_hits aggregation
top_hits指标聚合器跟踪要聚合的最相关文档. 该聚合器旨在用作子聚合器,以便可以按存储分区汇总最匹配的文档. top_hits聚合器可以有效地用于通过存储桶聚合器按某些字段对结果集进行分组. 一 ...