1 感知机模型
1.1 模型定义
2 感知机学习策略
2.1 数据的线性可分性
2.2 学习策略
3 学习算法
3.1 算法原始形式
3.2 收敛性
3 学习算法的对偶形式

1 感知机模型

感知机perceptron是二类分类问题的线性分类模型，输入为实例的特征向量，输出为实例的类别（+1，-1）。感知机旨在求出训练数据进行线性划分的分离超平面（separating hyperplane），基于损失函数，利用梯度下降法对损失函数进行极小化，求得感知机模型，从而对新实例进行分类。它分为原始和对偶形式。1957年Rossenblatt提出。

1.1 模型定义

从输入空间到输出空间的映射（函数）：f(x)=sign(w·x+b)
其中，w是weight，x输入向量，b偏置bias，sign是符号函数，即

假设空间是定义在所有特征空间上的函数（线性分类模型）的集合{f|f(x)=w·x+b}
感知机解释：
线性方程w·x+b=0对应于特征空间Rn一个超平面，w是超平面的法向量，b是超平面的截距，超平面S将实例分为正负两类。

2 感知机学习策略

2.1 数据的线性可分性

如果对于数据集T，存在一个超平面能够完全正确的将其划分到超平面的两侧称为数据集线性可分linear separable

2.2 学习策略

假设数据线性可分，为了求出超平面，需要求出w和b，需要一个学习策略（如何找到超平面的计算方法），即定义损失函数，并将损失函数最小化。
定义损失函数：误分类点总数到超平面S的总距离。
输入空间Rn任一点到平面的距离是：点到平面的距离

误分类点满足：

因此误分类点到平面的距离是：

假设总共有M个误分类点，则总距离为：

不考虑常数项||w||,就是感知机的损失函数，即

在误分类时，L为w，b的连续可导函数。正确分类时L为0。

3 学习算法

主要就是对上述损失函数进行求解全局最小（优）值（极小值）

3.1 算法原始形式

具体采用随机梯度下降法（stochastic gradient descent SGD）：首先任意选取一个超平面w0，b0，然后梯度下降法不断地极小化目标表函数，极小化过程不是一次使M中所有误分类点梯度下降，而是一次随机选取一个误分类点使其梯度下降。
梯度为：

具体算法过程：

3.2 收敛性

首先将b并入w得到w hat，将x添加一维1，形式将被简化。于是得到：

迭代次数k有一个上限，说明原始算法是可收敛的，前提是数据线性可分。

3 学习算法的对偶形式

说明一点，感知机的学习算法是支持向量机学习算法的基础，这里原始形式和对偶形式与之对应。

Gram 矩阵：

MATLAB示例：

 x1=[3,3]',

 x2=[4,3]',

 x3=[1,1]',

 G=[x1'*x1,x1'*x2,x1'*x3;

     x2'*x1,x2'*x2,x2'*x3;

     x3'*x1,x3'*x2,x3'*x3]

class-感知机Perception的更多相关文章

深度学习基础-基于Numpy的感知机Perception构建和训练
1. 感知机模型感知机Perception是一个线性的分类器,其只适用于线性可分的数据. f(x) = sign(w.x + b) 其试图在所有线性可分超平面构成的假设空间中找 ...
CS229 笔记03
CS229 笔记03 局部加权线性回归 Non-Parametric Learning Algorithm (非参数学习方法) Number of parameters grows with the ...
多层感知机及其BP算法（Multi-Layer Perception）
Deep Learning 近年来在各个领域都取得了 state-of-the-art 的效果,对于原始未加工且单独不可解释的特征尤为有效,传统的方法依赖手工选取特征,而 Neural Network ...
【MLP】多层感知机网络
BPN(Back Propagation Net) 反向传播神经网络是对非线性可微分函数进行权值训练的多层网络,是前向神经网络的一种. BP网络主要用于: 1)函数逼近与预测分析:用输入矢量和相应的输 ...
机器学习理论基础学习3.1--- Linear classification 线性分类之感知机PLA（Percetron Learning Algorithm）
一.感知机(Perception) 1.1 原理: 感知机是二分类的线性模型,其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型. 假设训练数据集是线性可分的,感知机学习的目标 ...
感知机学习算法（PLA）
Perception Learning Algorithm, PLA 1.感知机感知机是一种线性分类模型,属于判别模型. 感知机模型给出了由输入空间到输出空间的映射: f(X) = sign(WTX ...
matlab 实现感知机线性二分类算法（Perceptron）
感知机是简单的线性分类模型 ,是二分类模型.其间用到随机梯度下降方法进行权值更新.参考他人代码,用matlab实现总结下. 权值求解过程通过Perceptron.m函数完成 function W = ...
感知机(perceptron)概念与实现
感知机(perceptron) 模型: 简答的说由输入空间(特征空间)到输出空间的如下函数: \[f(x)=sign(w\cdot x+b)\] 称为感知机,其中,\(w\)和\(b\)表示的是感知机 ...
统计学习方法 --- 感知机模型原理及c++实现
参考博客 Liam Q博客和李航的<统计学习方法> 感知机学习旨在求出将训练数据集进行线性划分的分类超平面,为此,导入了基于误分类的损失函数,然后利用梯度下降法对损失函数进行极小化,从而 ...
统计学习中感知机的C++代码
感知机是古老的统计学习方法,主要应用于二类线性可分数据,策略是在给定的超平面上对误差点进行纠正,从而保证所有的点都是正确可分的. 用到的方法是随机梯度下降法,由于是线性可分的,可保证最终在有限步内收敛 ...

随机推荐

BZOJ 1778: [Usaco2010 Hol]Dotp 驱逐猪猡 [高斯消元概率DP]
1778: [Usaco2010 Hol]Dotp 驱逐猪猡题意:一个炸弹从1出发p/q的概率爆炸,否则等概率走向相邻的点.求在每个点爆炸的概率高斯消元求不爆炸到达每个点的概率,然后在一个点爆炸就 ...
python爬站长之家写一个信息搜集器
前言:不知道写什么好,绕来绕去还是写回爬虫这一块. 之前的都爬了一遍.这次爬点好用一点的网站. 0x01: 自行备好requests模块目标站:http://tool.chinaz.com/ 0x2 ...
读书共享 Primer Plus C-part 9
第十二章存储类.链接和内存管理针对代码块中的static变量做如下范本 #include ...
css设置兼容的透明样式
css设置透明并实现兼容: <style>div{ filter: alpha(opacity=80); -moz-opacity: 0.8; -khtml-opacity: 0.8; o ...
基于Parallax设计HTML视差效果
年关将至,给大家拜年. 最近时间充裕了一点,给大家介绍一个比较有意思的控件:Parallax.它可以用来实现鼠标移动时,页面上的元素也做偏移的视差效果.在一些有表现层次,布局空旷的页面上,用来做Hea ...
C# decimal 去掉小数点后的无效0
c#去掉小数点后的无效0 decimal d = 0.0500m; d.ToString("0.##")就出来了也可以这样 string.Format("{0:0.## ...
VSCode插件MSSQL教程（昨天提了一下）
推荐一个跨平台SQL IDE:https://docs.microsoft.com/zh-cn/sql/sql-operations-studio/download 什么数据库都木有(系统自带的不算) ...
SqlBulkCopy 参数配置示例
SqlBulkCopy 做为SQL Server 官方批量入库类,性能不会太差.针对其参数做了一些测试. A. 先准备测试场景 ,关于SqlBulkCopyOptions.KeepIdenti ...
PHP常见面试题总结
1.include 和 require 都能把另外一个文件包含到当前文件中他们有什么区别?include 和 include_once 又有什么区别? 二者区别只有一个,那就是对包含文件的需求程度 ...
解决 java.lang.ClassNotFoundException: org.springframework.beans.factory.config.EmbeddedValueResolver
1.今天用maven配置了一下dubbo的项目发现启动项目后意外报错: java.lang.ClassNotFoundException: org.springframework.beans.fact ...

class-感知机Perception