Perception Learning Algorithm, PLA

1.感知机

感知机是一种线性分类模型，属于判别模型。

感知机模型给出了由输入空间到输出空间的映射：

　　f(X) = sign(W^TX + b)

简单来说，就是找到一个分类超平面 W^TX + b =0，将数据集中的正例和反例完全分开。

2.感知机学习算法（PLA）

感知机学习算法是为了找到 W 和 b 以确定分类超平面。为了减少符号，令 W = [b, W₁, W₂, ..., W_n]， X = [1, X₁, X₂, ..., X_n]，则 f(X) = sign(W^TX )。

感知机学习算法是由误分类驱动的：

对于实际为正例(y=1)的误分类点，则对 W 进行如下修正：

　　　　W = W + X

　　　　从而使得 W^TX 变大，更接近大于 0, 即更接近正确分类； (W+X)^TX = W^TX + ||X||²

对于实际为正例(y=1)的误分类点，则对 W 进行如下修正：

　　　　W = W - X　　　　

　　　　从而使得 W^TX 变小，更接近小于 0, 即更接近正确分类； (W-X)^TX = W^TX - ||X||²

综上，令 W 初值 W₀=0，然后每次选取一个误分类点，更新 W = W + y X ，直到所有点都被正确分类。

PS：不同的初值或者选取不同的误分类点，解可以不同。

具体算法如下：

3. PLA算法的收敛性

首先，确定数据集是 线性可分 的，否则，PLA永远不收敛。

假设数据集线性可分，则一定存在一个分类超平面可以将正例负例完全区分。

设最优的参数为 W_f，则：

　　y_iW_f^TX_i≥ min_n(y_nW_f^TX_n) > 0

已知 W_f^TW 越大，则 W 与 W_f 越接近。（联想协方差）

　　W_f^TW_T= W_f^T (W_T-1+ y_T-1X_T-1)

= W_f^T W_T-1+ y_T-1W_f^TX_T-1

≥ W_f^T W_T-1+ min_n(y_nW_f^TX_n) (1)

> W_f^T W_T-1+ 0

然而，W_f^TW 越大，也有可能只是 W 的元素值放大，但是W 与 W_f 的角度却没有接近。

所以，我们要讨论 $\frac{W_{f}^{T}W_{T}}{\left \| W_{f} \right \|\left \| W_{T} \right \|}$ 是否越来越大，若是，则 W 越来越接近最优值 W_f。（联想 SVM 中函数间隔和集合间隔的概念）

我们知道，PLA 是误分类点驱动，所以有：

　　y_iW^TX_i≤ 0

又有：

　　W_T= W_T-1+ y_T-1X_T-1

则：

　　|| W_T||² = || W_T-1||² + y_T-1²|| X_T-1||² + 2 y_T-1 W_T-1^T X_T-1

≤ || W_T-1||² + y_T-1²|| X_T-1||² = || W_T-1||² + || X_T-1||²

≤ || W_T-1||² + min_n|| X_n||² (2)

设 W₀ = 0

令 ρ = min_n(y_nW_f^TX_n) ，代入式 (1):

　　W_f^TW_T ≥ W_f^T W_T-1+ ρ ≥ W_f^T W_T-2+ 2ρ ≥ ... ≥ W_f^T W₀+ Tρ = Tρ (3)

令 R = min_n|| X_n||² ，代入式 (2):

　　|| W_T||² ≤ || W_T-1||² + R² ≤ || W_T-2||² + 2R² ≤ ... ≤ || W₀||² + TR² = TR²(4)

由 (4), 则：

　　$\left \| W_{f} \right \|\left \| W_{T} \right \|\leq \left \| W_{f} \right \|\sqrt{T}R$ (5)

由 (3) (5)：

　　$\frac{W_{f}^{T}W_{T}}{\left \| W_{f} \right \|\left \| W_{T} \right \|}\geq \frac{T\rho }{\left \| w_{f} \right \|\sqrt{T}R}=\frac{\sqrt{T}\rho }{\left \| W_{f} \right \|R}$ (6)

可以看到，$\frac{W_{f}^{T}W_{T}}{\left \| W_{f} \right \|\left \| W_{T} \right \|}$ 随着迭代次数 T 的增加而增加，说明 W 在向着最优值 W_f 逐渐靠近。

由 (6) :

　　$\frac{\sqrt{T}\rho}{\left \| W_{f} \right \|R}\leq 1$ 向量点积，当 W_T = W^f 时 cosθ = cos0 = 1

　　=> $T\leq \frac{\left \| W_{f} \right \|^{2}R^{2}}{\rho ^{2}}$

令 $\gamma =\frac{\rho }{\left \| W_{f} \right \|}$：

　　=> $T\leq \frac{R^{2}}{\gamma ^{2}} $ (7)

式 (7) 表明，迭代次数（误分类的次数）T 有上界，经过有限次迭代可以找到将训练数据完全正确分开的分类超平面。

这就说明，当训练数据集线性可分时，PLA 迭代是收敛的。

PS：PLA 可以有许多解，当选择不同的初值或者选择的误分类点的顺序不同时，解可以不同。

4.线性不可分时的PLA（Pocket 算法）

5.PLA的对偶形式

2018-09-03

感知机学习算法（PLA）的更多相关文章

【机器学习】感知机学习算法（PLA）
感知机问题学习算法引入:信用卡问题根据已知数据(不同标准的人的信用评级)训练后得出一个能不能给新客户发放信用卡的评定结果解决该问题的核心思想扔为之前所讲到的梯度下降算法,对于更多条件的类似问题,首 ...
感知机学习算法 python实现
参考李航<统计学习方法> 一开始的感知机章节,看着不太复杂就实现一下... """ 感知机学习算法的原始形式例2.1 """ ...
感知机学习算法Java实现
感知机学习算法Java实现. Perceptron类用于实现感知机, 其中的perceptronOriginal()方法用于实现感知机学习算法的原始形式: perceptronAnother()方法用 ...
利用Python实现一个感知机学习算法
本文主要参考英文教材Python Machine Learning第二章.pdf文档下载链接: https://pan.baidu.com/s/1nuS07Qp 密码: gcb9. 本文主要内容包括利 ...
吴裕雄 python 机器学习——人工神经网络感知机学习算法的应用
import numpy as np from matplotlib import pyplot as plt from sklearn import neighbors, datasets from ...
感知器算法PLA
for batch&supervised binary classfication,g≈f <=> Eout(g)≥0 achieved through Eout(g)≈Ein(g ...
CS229 Lesson 5 生成学习算法
课程视频地址:http://open.163.com/special/opencourse/machinelearning.html 课程主页:http://cs229.stanford.edu/ 更 ...
[C#][算法] 用菜鸟的思维学习算法 -- 马桶排序、冒泡排序和快速排序
用菜鸟的思维学习算法 -- 马桶排序.冒泡排序和快速排序 [博主]反骨仔 [来源]http://www.cnblogs.com/liqingwen/p/4994261.html 目录马桶排序(令人 ...
Stanford大学机器学习公开课（五）：生成学习算法、高斯判别、朴素贝叶斯
(一)生成学习算法在线性回归和Logistic回归这种类型的学习算法中我们探讨的模型都是p(y|x;θ),即给定x的情况探讨y的条件概率分布.如二分类问题,不管是感知器算法还是逻辑回归算法,都是在解 ...

随机推荐

前端路由原理及vue-router介绍
前端路由原理本质就是监听 URL 的变化,然后匹配路由规则,显示相应的页面,并且无须刷新.目前单页面使用的路由就只有两种实现方式 hash history www.test.com/##/ 就是 Ha ...
webpack4——打包html报错解决
①先引入html-webpack-plugin插件,然后在终端下载 npm install --save-dev html-webpack-plugin ②我的文件结构 ③修改webpack.dev. ...
关于 NSData 的数据类型(2进制,16进制之间)及深入剖析(转)
. NSData 与 NSString NSData-> NSString NSString *aString = [[NSString alloc initWithData:adataenco ...
django写一个简单的登陆注册
要写这个,前提还是需要知道三个知识: 一个是urls.py,它是写我们的路由关系的,之前我写了通过wsgiref写一个简单的服务端,也用到了路由,就是请求过来的url和视图函数的对应关系. 二是就是 ...
jquery表单属性筛选元素
$(":button") 选择所有按钮元素类型为按钮的元素. 等于$('input[type="button"]') $(":checkbox&quo ...
eclipse 突然debug模式不能正常运行了
eclipse 突然debug模式不能正常运行了,但非debug模式却能正常运行.debug模式不能正常启动的现象描述如下: 点击eclipse debug按钮,console窗口显示tomca ...
JS中常见算法问题
JS中常见算法问题 1. 阐述JS中的变量提升(声明提前) 答:将所有的变量提升当当前作用域的顶部,赋值留在原地.意味着我们可以在某个变量声明前就使用该变量. 虽然JS会进行变量提升,但并不会执行真正 ...
vuex vue状态管理
第一步安装vuex(安装在生产环境) npm install vuex 第二步 src下新建store文件夹用来专门放状态管理,store文件夹下新建四个js文件 index.js actions ...
禁止鼠标点右键 - 防止刷新页面 - 禁止复制 chrome 和 firefox不能复制
document.oncontextmenu = function () {//点右键,啥反应都没有了 return false; } document.onkeydown = function () ...
maven-生命周期与插件
Maven的生命周期是抽象的,具体的操作由插件实现,类似于java的模板设计模式. 1.生命周期认识生命周期 maven有clean.default.site三种生命周期,每种生命周期都包含一些阶段 ...

感知机学习算法（PLA）