Backtracking line search的理解

使用梯度下降方法求解凸优化问题的时候，会遇到一个问题，选择什么样的梯度下降步长才合适。

假设优化函数为，若每次梯度下降的步长都固定，则可能出现左图所示的情况，无法收敛。若每次步长都很小，则下降速度非常慢，需要很多轮的迭代，如右图所示。所以步长的选择和收敛速度是一个取舍关系。

于是，有了一种可调节步长的解法，称为backtracking line search。

假设我们当前的位置为X_c 并且要在d方向上寻找更优的解，那么问题就变为了估计Φ(t)的最小值，t是步长。

关于P的新的解是。那么怎么来估计这个步长呢？（直接把课件的幻灯片贴上来了）

也就是说，设f(x)在X_c的导数，再设两个变量r和c∈(0, 1).

因为r∈(0, 1)，所以r^v随着v的增大而趋向于0，也就是步长t逐渐减小，直到找到满足条件的r^v。之前已经设定了，所以必定有

课件里给出了一段Matlab的伪代码，翻译过来差不多就是这样

function t = BLS(f,d,x,r,c)

% Backtracking line search

% Input :

% f: MATLAB file that returns function value

% d: The search direction

% x: current x

% r : backtrack step between (,) usually /

% c: (,) usually ^{-}

% Output :

% t: adaptive step length

[fc, gc] = feval(f,x);

xc = x;

x = xc + t*d;

fk1 = feval(f,x);
t = 1;

while fk1 > fk + c*t*(gk'*d)
    t= t*r; 
    x = xc + t*d; 
    fk1 = feval(f,x); 
end

最后，课件里给出了寻找方向d的几种方法

参考资料：

http://www.stat.cmu.edu/~ryantibs/convexopt/lectures/05-grad-descent.pdf

https://www.math.washington.edu/~burke/crs/408/lectures/L7-line-search.pdf

Backtracking line search的理解的更多相关文章

重新发现梯度下降法--backtracking line search
一直以为梯度下降很简单的,结果最近发现我写的一个梯度下降特别慢,后来终于找到原因:step size的选择很关键,有一种叫backtracking line search的梯度下降法就非常高效,该算法 ...
【原创】回溯线搜索 Backtracking line search
机器学习中很多数值优化算法都会用到线搜索(line search).线搜索的目的是在搜索方向上找到是目标函数$f(x)$最小的点.然而,精确找到最小点比较耗时,由于搜索方向本来就是近似,所以用较小 ...
Line Search and Quasi-Newton Methods 线性搜索与拟牛顿法
Gradient Descent 机器学习中很多模型的参数估计都要用到优化算法,梯度下降是其中最简单也用得最多的优化算法之一.梯度下降(Gradient Descent)[3]也被称之为最快梯度(St ...
Line Search and Quasi-Newton Methods
Gradient Descent 机器学习中很多模型的参数估计都要用到优化算法,梯度下降是其中最简单也用得最多的优化算法之一.梯度下降(Gradient Descent)[3]也被称之为最快梯度(St ...
线搜索(line search)方法
在机器学习中, 通常需要求某个函数的最值(比如最大似然中需要求的似然的最大值). 线搜索(line search)是求得一个函数$f(x)$的最值的两种常用迭代方法之一(另外一个是trust re ...
line search中的重要定理 - 梯度与方向的点积为零
转载请注明出处:http://www.codelast.com/ 对精确的line search(线搜索),有一个重要的定理: ∇f(xk+αkdk)Tdk=0 这个定理表明,当前点在dk方向上移动到 ...
Beam Search快速理解及代码解析
目录 Beam Search快速理解及代码解析(上) Beam Search 贪心搜索 Beam Search Beam Search代码解析准备初始输入序列扩展准备输出总结 Beam Sea ...
Beam Search快速理解及代码解析(下)
Beam Search的问题先解释一下什么要对Beam Search进行改进.因为Beam Search虽然比贪心强了不少,但还是会生成出空洞.重复.前后矛盾的文本.如果你有文本生成经验,一定对这些 ...
Beam Search快速理解及代码解析（上）
Beam Search 简单介绍一下在文本生成任务中常用的解码策略Beam Search(集束搜索). 生成式任务相比普通的分类.tagging等NLP任务会复杂不少.在生成的时候,模型的输出是一个时 ...

随机推荐

深入浅出设计模式——代理模式（Proxy Pattern）
模式动机在某些情况下,一个客户不想或者不能直接引用一个对象,此时可以通过一个称之为“代理”的第三者来实现间接引用.代理对象可以在客户端和目标对象之间起到中介的作用,并且可以通过代理对象去掉客户不能看到 ...
[bzoj3155]Preprefix sum(树状数组)
3155: Preprefix sum Time Limit: 1 Sec Memory Limit: 512 MBSubmit: 1183 Solved: 546[Submit][Status] ...
implicit operator
class Digit { public Digit(double d) { val = d; } public double val; // ...other members // User-def ...
mysql 命令（一）
1. 函数向日期添加指定的时间间隔 DATE_ADD(date,INTERVAL expr type)eg:DATE_ADD(CURDATE(),INTERVAL 1 MONTH) //在当前时间加一 ...
匿名函数和Lamda
不是本人所写!网络收集 C#中的匿名函数和Lamda是很有意思的东东,那么我们就来介绍一下,这到底是什么玩意,有什么用途了? 打开visual studio 新建一个控制台程序. 我们利用委托来写一个 ...
iOS开发火星坐标转百度坐标
CLLocationCoordinate2D coor = CLLocationCoordinate2DMake(latitude, longitude);//原始坐标 //转换 google地图.s ...
生物信息大数据&数据库（NCBI、EBI、UCSC、TCGA）
想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件: -生物信息学:导论与方法北大\ 生物信息数据库及软件资源一个优秀的生信开发者能够解决如下问题: 如何鉴定一个重要的且没 ...
jq 实现发送验证码倒计时功能
var util = { wait:60, hsTime: function (that) { _this = this; if (_this.wait == 0) { $('#hsbtn').rem ...
补psp进度（11月4号-9号）
这周psp进度 11月4号内容开始时间结束时间打断时间净时间小伙伴聊天实现 9:45 10:49 0 64m 学习HttpURLConnection 14:13 15:48 10m 85m ...
Ubuntu12.04安装64位系统出现编译错误error while loading shared libraries: libz.so.1: cannot open shared object file: No such file or dir
问题: Ubuntu12.04安装64位系统出现编译错误error while loading shared libraries: libz.so.1: cannot open shared obje ...

Backtracking line search的理解

Backtracking line search的理解的更多相关文章

随机推荐

热门专题