更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/

坐标轴下降法

坐标轴下降法顾名思义，沿着坐标轴下降。坐标轴下降法和梯度下降法使用的都是迭代法，即使用启发式的方式一步一步迭代求解函数的最小值。

可以想象一个可微的凸函数\(J(\omega)\)，其中\(\omega\)是一个\(n*1\)维的向量。如果在这\(n\)维空间中存在着某一点\(\overline{\omega}\)能够使得\(J(\omega)\)在每一个坐标轴上都是最小的，那么我们则可以说\(J(\overline{\omega})\)是全局最小值。如二维空间\((x,y)\)中的曲线\(x^2\)，当\(x\)和\(y\)都是最小的时候，即为曲线\(x^2\)最小值的时候。(注：Lasso回归的目标函数虽然不可微，但是由于目标函数非正则项是可微的，L1正则项是凸函数，因此也可以使用该结论。)

一、坐标轴下降法流程

坐标轴下降法即在\(\omega\)的每个坐标轴上做迭代下降，当每个坐标轴上的值都收敛时，则可以说明达到了\(J(\omega)\)的全局最小值。

\(\omega\)取初值记为\(\omega^{(0)}\)，其中\((0)\)表示迭代的轮数，初轮数为0。
对于第\(k\)轮的迭代，依次求解\({\omega_i}^{(k)} \quad(i=1,2,\cdots,n)\)，即
\[
{\omega_i}^{(k)} \in \underbrace{argmin}_{\omega_i}\,J({\omega_1}^{(k)},{\omega_2}^{(k)},\cdots,{\omega_n}^{(k)})
\]
其中由于在每次单独对一个坐标轴迭代的时候其他坐标轴上的值为常数。也就是\({\omega_i}^{(k)}\)是使\(J({\omega_1}^{(k)},{\omega_i-1}^{(k)},{\omega_i+1}^{(k)},\cdots,{\omega_n}^{(k)})\)为最小的值，除了\({\omega_i}^{(k)}\)为变量外，其他参数都为常数，则对\(J({\omega_1}^{(k)},{\omega_i-1}^{(k)},{\omega_i+1}^{(k)},\cdots,{\omega_n}^{(k)})\)求导即可得该函数的最小值。
检查\({\omega}^{(k)}\)和\({\omega}^{(k-1)}\)在每个维度上的变化情况，如果所有维度的变换都小于某个阈值，则\({\omega}^{(k)}\)为最终结果，否则循环第2步，进入\(k+1\)次迭代。

二、坐标轴下降法和梯度下降法的异同

两者都是迭代方法，并且每一轮迭代都需要\(O(mn)\)的计算量，其中\(m\)为样本数，\(n\)为特征数。
坐标轴下降法固定\(n-1\)个坐标，沿着剩下的一个坐标轴迭代，得到函数的局部最小值；梯度下降法则是沿着梯度的负方向得到函数的局部最小值。
坐标轴下降法是一种非梯度优化算法，但是一个周期中循环使用不同的坐标方向迭代，相当于梯度下降的一轮迭代。
由于坐标轴下降法是利用当前坐标方向迭代，不需要求目标函数的倒数；梯度下降法是利用目标函数的偏导数来确定迭代方向的。

A-04 坐标轴下降法的更多相关文章

Lasso回归算法：坐标轴下降法与最小角回归法小结
前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结.里面对线程回归的正则化也做了一个初步的介绍.提到了线程回归的L2正则化-Ridge回归,以及线程回归的L1正则化-Lasso回归.但是对 ...
plot sin 04 坐标轴居中
plot sin 04 坐标轴居中 code #!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import matpl ...
逻辑回归原理_挑战者飞船事故和乳腺癌案例_Python和R_信用评分卡（AAA推荐）
sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&a ...
数据挖掘-逻辑Logistic回归
逻辑回归的基本过程:a建立回归或者分类模型--->b 建立代价函数 ---> c 优化方法迭代求出最优的模型参数 --->d 验证求解模型的好坏. 1.逻辑回归模型: 逻辑回归(L ...
python机器学习笔记：EM算法
EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域的基础,比如隐式马尔科夫算法(HMM),LDA主题模型的变分推断算法等等.本文对于E ...
scikit-learn 逻辑回归类库使用小结
之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结.这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结.重点讲述调参中要注意的事项. 1. 概述在scikit-lear ...
scikit-learn 线性回归算法库小结
scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景. 线性回归的目的是要得到输 ...
MCMC(四)Gibbs采样
MCMC(一)蒙特卡罗方法 MCMC(二)马尔科夫链 MCMC(三)MCMC采样和M-H采样 MCMC(四)Gibbs采样在MCMC(三)MCMC采样和M-H采样中,我们讲到了M-H采样已经可以很好 ...
EM算法原理总结
EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等.本文就对 ...

随机推荐

分析一次double强转float的翻车原因
背景人逢喜事精神爽,总算熬到下班撩~~ 正准备和同事打个招呼回家,被同事拖住问了.
uwsgi基本介绍安装和测试--使用Django建立你的第一个网站
一基本介绍对像我这样不是专业做网络的人来说,uuwsgi是一个陌生的东西.它是谁?它可以做什么?谁会用到它?其实,在不知道一个东西是什么的情况下,能够快速的了解并使用它,是一门很有艺术性的事情.最 ...
每天学会一点点(HashMap实现原理及源码分析)
HashMap实现原理及源码分析哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希 ...
MyBatis的发展和选型
xlecho编辑整理,欢迎转载,转载请声明文章来源.欢迎添加echo微信(微信号:t2421499075)交流学习. 百战不败,依不自称常胜,百败不颓,依能奋力前行.--这才是真正的堪称强大!! 参考 ...
oracle用imp导入dmp文件
oracle命令行登录 sqlplus 用户名/密码创建用户 create user 用户 identified by 密码 ; 创建表空间 create tablespace 表空间名 dataf ...
Nacos配置服务原理
Nacos Client配置机制 spring加载远程配置在了解NACOS客户端配置之前,我们先看看spring怎么样加载远程配置的.spring 提供了加载远程配置的扩展接口 PropertySo ...
.Net基础篇_学习笔记_第四天_switch-case
swith-case 用来处理多条件的定值的判断. 语法: switch(变量或者表达式的值) { case 值1:要执行的代码: break: case 值2:要执行的代码: break: case ...
Yum未完成事务问题
1.安装 yum-complete-transaction [root@linux-node1 ~]# yum -y install yum-utils 2.清除yum缓存 [root@linux-n ...
JAVA父类的静态方法能否被子类重写？
静态: 在编译时所分配的内存会一直存在(不会被回收),直到程序退出内存才会释放这个空间,在实例化之前这个方法就已经存在于内存,跟类的对象没什么关系.子类中如果定义了相同名称的静态方法,并不会重写,而应 ...
转换地图（康托展开+预处理+BFS）
Problem Description 在小白成功的通过了第一轮面试后,他来到了第二轮面试.面试的题目有点难度了,为了考核你的思维能量,面试官给你一副(2x4)的初态地图,然后在给你一副(2x4)的终 ...

A-04 坐标轴下降法

坐标轴下降法

一、坐标轴下降法流程

二、坐标轴下降法和梯度下降法的异同

A-04 坐标轴下降法的更多相关文章

随机推荐

热门专题