Levenberg-Marquardt迭代（LM算法）-改进Guass-Newton法

              1、前言

                               a、对于工程问题，一般描述为：从一些测量值（观测量）x 中估计参数 p？即x = f(p)，

                             其中，x为测量值构成的向量，参数p为待求量，为了让模型能适应一般场景，这里p也为向量。

                             这是一个函数求解问题，可以使用Guass-Newton法进行求解，LM算法是对Newton法的改进。

                         c、如果函数f为线性函数，那这个问题就变成了最小二乘问题（请参阅我另一篇博客：最小二乘法），

                         d、这篇博客中讲解的LM法、Newton法主要用于函数f为非线性函数的情况。

              2、x = f(p)问题的Newton法求解

                               当迭代到第k次的时候得到参数 $p_k$ ，其中 $\varepsilon_k$ 为残差：

                                              $x-f({p_k})={\varepsilon_k}\quad(1)$

                         对f(p)进行一阶泰勒公式展开,J为Jacobi(雅可比)矩阵，因为参数p是个向量，因此对p的求导即对p逐个元素求偏导：

                                              $f({p_{k+1}})=f({p_k}+\Delta)\approx{f({p_k})+J\Delta}\quad(2)$

                         计算第k+1次的残差：

                                              $x-f({p_{k+1}})=x-f({p_k})-J\Delta={\varepsilon_k}-J\Delta\quad(3)$

                         通过第k次到第k+1次的迭代，

                         可以发现已经把非线性问题 $x-f({p_{k+1}})=0$ 转化为线性求解 ${\varepsilon_k}-J\Delta=0$ ，则最小二乘解为：

                                              ${J^T}J\Delta={J^T}{\varepsilon_k}\quad(4)$

                                              $\Delta={({J^T}J)^{-1}}{J^T}{\varepsilon_k}\quad(5)$

                         则k+1次的参数p为：

                                              ${p_{k+1}}={p_k}+\Delta\quad(6)$

              3、加权Newton迭代

                               在Newton法中，所有的因变量都是等量加权的，除此之外，可以使用一个加权的矩阵对因变量进行加权。

                         例如，当测量矢量 x 满足一个协方差矩阵为 ${\Sigma_x}$ 的高斯分布，且希望最小化Mahalanobis距离 $||x-f(p)|{|_\Sigma}$ 。

                                 当这个协方差矩阵可以是对角的，则表示 x 各坐标之间相互独立。

                                 当协方差矩阵为正定对称矩阵时，正规变为：

                                             ${J^T}{\Sigma^{-1}}J{\Delta_k}={J^T}{\Sigma^{-1}}{\varepsilon_k}\quad(7)$

                                             ${\Delta_k}={({J^T}{\Sigma^{-1}}J)^{-1}}{J^T}{\Sigma^{-1}}{\varepsilon_k}\quad(8)$

                                   备注：马氏距离 $d(x,y)=\sqrt{{{(x-y)}^T}{\Sigma^{-1}}(x-y)}$

                         通过协方差反向传播，一阶近似下的协方差可以这么计算：

                                   $\Sigma={({J^T}\Sigma{_x^{-1}}J)^{-1}}$

                         如果不可逆，那这个取逆过程为广义逆。

              4、Levenberg-Marquardt迭代（LM算法）

                               LM算法是对Newton迭代的改进。

                        （4）式的正规方程可以简化写成： $N\Delta={J^T}J\Delta={J^T}\varepsilon$

                         LM算法将上式改为： $N'\Delta={J^T}\varepsilon$ ，其中 ${N_{ii}^'}=(1+\lambda){N_{ii}}$ ，即N的对角线元素乘以 $(1+\lambda)$ ，非对角线元素不变 ${N_{ij}^'}={N_{ij}}\quad(i{\ne}j)$

                         $\lambda$ 的设定策略为：在初始化时， $\lambda$ 通常设定为 ${10^{-3}}$ 。

                                             如果通过解增量正规方程得到的 $\Delta$ 导致误差减小，那么接受该增量并在下一次迭代前将 $\lambda$ 除以10。

                                             反之，如果 $\Delta$ 值导致误差增加，那么将 $\lambda$ 乘以10并重新解增量正规方程，继续这一过程直到求出的一个误差下降的 $\Delta$ 为止。

                                             对不同的 $\lambda$ 重复地解增量正规方程直到求出一个可以接受的 $\Delta$ 。

                               LM算法的直观解释：当 $\lambda$ 非常小时，该方法与Newton迭代本质相同。

                                                 当 $\lambda$ 非常大时（本质上大于1），此时 ${J^T}J$ 的非对角线元素相对于对角元素而言变得不重要，此时算法倾向于下降法。

                                                  LM算法在Newton迭代和下降方法之间无缝地移动，Newton法将使得算法在解的领域附近快速收敛，下降法使得算法在

                                                  运行困难时保证代价函数是下降的。

              5、Newton法（LM法）两个适用场景的转换

                               a、在上一篇博客Newton法（牛顿法 Newton Method）中讲述了牛顿法适用的两个场景：1、函数求解；2、目标函数的最优化求解

                             上一篇博客中的f(x)相当于这篇博客中的 x –f(p)，上一篇博客中是为了求x，这篇博客中是已知x，求p，只是表述不同。

                               b、这两个场景有时候是可以相互转换的：

                             例如：函数求解问题 f(x) = 0，那也可以认为是求解 min||f（x)||，其中||.||表示二范数，即 $\min{f^2{(x)}}$

                             例如：目标函数优化问题 min ||f(x)||，当这个优化问题的理论最优解就是为 0 时，那么这个问题也可以转化为求解 f(x) = 0

自己所有博客汇总

Levenberg-Marquardt迭代（LM算法）-改进Guass-Newton法的更多相关文章

LM算法
最小二乘法的概念最小二乘法的目标:求误差的最小平方和,对应有两种:线性和非线性. 线性最小二乘的解是closed-form即x=(A^T A)^{-1}A^Tb, 而非线性最小二乘没有closed- ...
LM算法与非线性最小二乘问题
摘录的一篇有关求解非线性最小二乘问题的算法--LM算法的文章,当中也加入了一些我个人在求解高精度最小二乘问题时候的一些感触: LM算法,全称为Levenberg-Marquard算法,它可用于解决非线 ...
BP神经网络算法改进
周志华机器学习BP改进试设计一个算法,能通过动态调整学习率显著提升收敛速度,编程实现该算法,并选择两个UCI数据集与标准的BP算法进行实验比较. 1.方法设计传统的BP算法改进主要有两类: - 启 ...
算法：Astar寻路算法改进，双向A*寻路算法
早前写了一篇关于A*算法的文章:<算法:Astar寻路算法改进> 最近在写个js的UI框架,顺便实现了一个js版本的A*算法,与之前不同的是,该A*算法是个双向A*. 双向A*有什么好处呢 ...
matlab实现高斯牛顿法、Levenberg–Marquardt方法
高斯牛顿法: function [ x_ans ] = GaussNewton( xi, yi, ri) % input : x = the x vector of 3 points % y = th ...
【强化学习】DQN 算法改进
DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法.主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现.下面给出公式 ...
Newton法（牛顿法 Newton Method）
1.牛顿法应用范围牛顿法主要有两个应用方向:1.目标函数最优化求解.例:已知 f(x)的表达形式,,求 ,及g(x)取最小值时 ...
JVM探究面试题 JVM的位置三种JVM：HotSpot 新生区 Young/ New 养老区 Old 永久区 Perm 堆内存调优GC的算法有哪些？标记清除法，标记压缩，复制算法，引用计数法
JVM探究面试题: 请你弹弹你对JVM的理解?Java8虚拟机和之前的变化更新? 什么是OOM?什么是栈溢出StackOverFlowError?怎么分析 JVM的常用调优参数有哪些? 内存快照如何 ...
算法时间复杂度的表示法O(n²)、O(n)、O(1)、O(nlogn)等是什么意思？
Java中 Set 和 List 集合的contains()方法,检查数组链表中是否包含某元素检查数组链表中是否包含某元素,使用 Set 而不使用 List 的原因是效率问题, 前者的 set ...

随机推荐

ipv4枯竭和ipv6的启用
IPv4是Internet Protocol version 4的缩写,中文翻译为互联网通信协议(TCP/IP协议)第四版,通常简称为网际协议版本4. IPv4使用32位(4字节)地址,因此地址空间中 ...
SpringMVC返回类型
7.SpringMVC的返回值类型和参数传递 1.SpringMVC的返回值类型 (1)ModelAndView返回值类型: 1.1当返回为null时,页面不跳转. 1.2当返回值没有指定视图名时,默 ...
Python2.7学习
网上很多代码都不适用于python3版本,所以还是转回版本2来学习了 install 安装模块特别简单 E:\01_SOFT\Python27\python -m easy_install sunb ...
爬虫（十）：scrapy命令行详解
建爬虫项目 scrapy startproject 项目名例子如下: localhost:spider zhaofan$ scrapy startproject test1 New Scrapy pr ...
Ubuntu16.04 安装 CUDA9.2（总结一些新手容易遇到的问题）
系统:Ubuntu16.04 64bit 显卡:Nvidia GEFORCE 940MX 驱动:NVIDIA-Linux-x86_64-396.18.run 软件:cuda_9.2.88_396.26 ...
bochs调试命令
Bochs几条基本指令: 通过物理地址查看内存时,可以不加参数'/nuf': 其中n指定显示的单元数,默认是1: u 指定每个显示单元的大小(b表示字节.h表示字(2字节).w表示双字(4字节)),默 ...
Hadoop（3）如何构建HDFS--HA,YARN---HA
什么是HA? HA的意思是High Availability高可用,指当当前工作中的机器宕机后,会自动处理这个异常,并将工作无缝地转移到其他备用机器上去,以来保证服务的高可用. HA方式安装部署才是最 ...
BZOJ1941Hide and Seek
做KD_tree的入门题. 问题就是求出任意一个点距其他点的最大曼哈顿距离和最小曼哈顿距离差,然后对其取min即可. 这个东西就是KD_tree可以轻松解决的了. 下面总结一下做KD_tree(不带修 ...
Java 多线程编程（锁优化）
转:https://mp.weixin.qq.com/s/lDuguEhuWiLY8ofBRy3tZA 并发环境下进行编程时,需要使用锁机制来同步多线程间的操作,保证共享资源的互斥访问. 加锁会带来性 ...
完全基于卷积神经网络的seq2seq
本文参考文献: Gehring J, Auli M, Grangier D, et al. Convolutional Sequence to Sequence Learning[J]. arXiv ...

Levenberg-Marquardt迭代（LM算法）-改进Guass-Newton法

Levenberg-Marquardt迭代（LM算法）-改进Guass-Newton法的更多相关文章

随机推荐

热门专题