感知机算法及BP神经网络

简介：感知机在1957年就已经提出，可以说是最为古老的分类方法之一了。是很多算法的鼻祖，比如说BP神经网络。虽然在今天看来它的分类模型在很多数时候泛化能力不强，但是它的原理却值得好好研究。先学好感知机算法，对以后学习神经网络，深度学习等会有很大的帮助。

一，感知机模型

（1）、超平面的定义

令w₁，w₂，...w_n，v都是实数(R) ，其中至少有一个w_i不为零，由所有满足线性方程w₁*x₁+w₂*x₂+...+w_n*x_n=v

的点X=[x₁,x₂,...x_n]组成的集合，称为空间R的超平面。

从定义可以看出：超平面就是点的集合。集合中的某一点X，与向量w=[w₁，w₂，...w_n]的内积，等于v

特殊地，如果令v等于0，对于训练集中某个点X：

w*X=w₁*x₁+w₂*x₂+...+w_n*x_n>0，将X标记为一类

w*X=w₁*x₁+w₂*x₂+...+w_n*x_n<0，将X标记为另一类

（2）、数据集的线性可分

对于数据集T={(X₁, y₁),(X₂, y₂)...(X_N, y_N)}，X_i belongs to Rⁿ，y_i belongs to {-1, 1}，i=1,2,...N

若存在某个超平面S：w*X=0

将数据集中的所有样本点正确的分类，则称数据集T线性可分。

所谓正确地分类，就是：如果w*X_i>0，那么样本点(X_i, y_i)中的 y_i 等于1

如果w*X_i<0，那么样本点(X_i, y_i)中的 y_i 等于-1

因此，给定超平面 w*X=0，对于数据集 T中任何一个点(X_i, y_i)，都有y_i(w*X_i)>0，这样T中所有的样本点都被正确地分类了。

如果有某个点(X_i, y_i)，使得y_i(w*X_i)<0，则称超平面w*X对该点分类失败，这个点就是一个误分类的点。

（3）、感知机模型

f(X)=sign(w*X+b)，其中sign是符号函数。

感知机模型，对应着一个超平面w*X+b=0，这个超平面的参数是(w,b)，w是超平面的法向量，b是超平面的截距。

我们的目标是，找到一个(w,b)，能够将线性可分的数据集T中的所有的样本点正确地分成两类。

二、感知机策略

策略的重点是定义损失函数，即构造出一种能都使得损失最小的函数结构

三、感知机算法

算法的输入为m个样本，每个样本对应于n维特征和一个二元类别输出1或者-1，如下：　　(x(0)1,x(0)2,...x(0)n,y0),(x(1)1,x(1)2,...x(1)n,y1),...(x(m)1,x(m)2,...x(m)n,ym)(x1(0),x2(0),...xn(0),y0),(x1(1),x2(1),...xn(1),y1),...(x1(m),x2(m),...xn(m),ym)

　　　　输出为分离超平面的模型系数θ向量

　　　　算法的执行步骤如下：

　　　　（1）定义所有x0x0为1。选择θ向量的初值和步长α的初值。可以将θ向量置为0向量，步长设置为1。要注意的是，由于感知机的解不唯一，使用的这两个初值会影响θ向量的最终迭代结果。

　　　　（2）在训练集里面选择一个误分类的点(x(i)1,x(i)2,...x(i)n,yi)(x1(i),x2(i),...xn(i),yi), 用向量表示即(x(i),y(i))(x(i),y(i))，这个点应该满足：y(i)θ∙x(i)≤0y(i)θ∙x(i)≤0

　　　　（3）对θ向量进行一次随机梯度下降的迭代：θ=θ+αy(i)x(i)θ=θ+αy(i)x(i)

　　　　（4）检查训练集里是否还有误分类的点，如果没有，算法结束，此时的θ向量即为最终结果。如果有，继续第2步。

四、感知机与感知机神经网络代码实现

net=newp([ ],);

inputweights=net.inputweights{,};

biases=net.biases{};

net=newp([- ;- ],);

net.IW{,}=[- ];

net.IW{,}

net.b{}=;

net.b{}

p1=[;],a1=sim(net,p1)

p2=[;-],a2=sim(net,p2)

p3={[;] [ ;-]},a3=sim(net,p3)

p4=[ ; -],a4=sim(net,p4)

net.IW{,}=[,];

net.b{}=[];

a1=sim(net,p1)

net=init(net);

wts=net.IW{,}

bias=net.b{}

net.inputweights{,}.initFcn='rands';

net.biases{}.initFcn='rands';

net=init(net);

bias=net.b{}

wts=net.IW{,}

a1=sim(net,p1)

net=newp([- ;- ],);

net.b{}=[];

w=[ -0.8]

net.IW{,}=w;

p=[;];

t=[];

a=sim(net,p)

e=t-a

help learnp

dw=learnp(w,p,[],[],[],[],e,[],[],[],[],[])

w=w+dw

net.IW{,}=w;

a=sim(net,p)

P=[-0.5  0.5 -0.1;-0.5  -0.5 ];

T=[   ]

net=newp([- ;- ],);

plotpv(P,T);

plotpc(net.IW{,},net.b{});

%hold on;

%plotpv(P,T);

net=adapt(net,P,T);

net.IW{,}

net.b{}

plotpv(P,T);

plotpc(net.IW{,},net.b{})

net.adaptParam.passes=;

net=adapt(net,P,T);

net.IW{,}

net.b{}

plotpc(net.IW{},net.b{})

net.adaptParam.passes=;

net=adapt(net,P,T)

net.IW{,}

net.b{}

plotpv(P,T);

plotpc(net.IW{},net.b{})

plotpc(net.IW{},net.b{})

a=sim(net,p);

plotpv(p,a)

p=[0.7;1.2]

a=sim(net,p);

plotpv(p,a);

hold on;

plotpv(P,T);

plotpc(net.IW{},net.b{})

P=[-0.5 -0.5 0.3 -0.1 -;-0.5 0.5 -0.5 1.0 ]

T=[    ];

net=newp([- ;- ],);

plotpv(P,T);

hold on;

linehandle=plotpc(net.IW{},net.b{});

E=;

net.adaptParam.passes=;

while (sse(E))

    [net,Y,E]=adapt(net,P,T);

    linehandle=plotpc(net.IW{},net.b{},linehandle);

    drawnow;

end;

axis([-  - ]);

net.IW{}

net.b{}

net=init(net);

net.adaptParam.passes=;

net=adapt(net,P,T);

plotpc(net.IW{},net.b{});

axis([-  - ]);

net.IW{}

net.b{}

net=newp([- ;- ],,'hardlim','learnpn');

plotpv(P,T);

linehandle=plotpc(net.IW{},net.b{});

e=;

net.adaptParam.passes=;

net=init(net);

linehandle=plotpc(net.IW{},net.b{});

while (sse(e))

[net,Y,e]=adapt(net,P,T);

linehandle=plotpc(net.IW{},net.b{},linehandle);

end;

axis([-  - ]);

net.IW{}

net.b{}

net=newp([- ;- ],);

net.trainParam.epochs=;

net=train(net,P,T);

pause;

linehandle=plotpc(net.IW{},net.b{});

hold on;

plotpv(P,T);

linehandle=plotpc(net.IW{},net.b{});

axis([-  - ]);

p=[1.0 1.2 2.0 -0.8; 2.0 0.9 -0.5 0.7]

t=[   ;   ]

plotpv(p,t);

hold on;

net=newp([-0.8 1.2; -0.5 2.0],);

linehandle=plotpc(net.IW{},net.b{});

net=newp([-0.8 1.2; -0.5 2.0],);

linehandle=plotpc(net.IW{},net.b{});

e=;

net=init(net);

while (sse(e))

[net,y,e]=adapt(net,p,t);

linehandle=plotpc(net.IW{},net.b{},linehandle);

drawnow;

end;

matlab运行结果：

图：1

五、BP神经网络

（1）基本思想

BP神经网络也称为后向传播学习的前馈型神经网络，是一种典型的神经网络。后向传播是一种学习算法，体现为BP的训练过程，该过程是需要监督学习的；前馈型网络是一种结构，体现为BP的网络构架，如图2就是一个典型的前馈型神经网络.这种神经网络结构清晰，使用简单，而且效率也很高，因此得到了广泛的重视和应用。反向传播算法通过迭代处理的方式，不断的调整连接神经元的网络权重，使得最终输出结果和预期结果的误差最小。广泛应用于各种分类系统，他也包括了训练和使用两个阶段。

图：2

（2）算法过程

BP神经网络算法训练阶段的流程图和伪代码如下图所示：

图：3

步骤一、初始化网络权重

步骤二、向前传播输入（前馈型网络）

步骤三、反向误差传播

步骤四、网络权重与神经元偏置调整

步骤五、判断结束

（3）BP神经网络代码实现

% BP网络

net=newff([- ; ],[,],{'tansig','purelin'},'traingd')

net.IW{}

net.b{}

p=[;];

a=sim(net,p)

net=init(net);

net.IW{}

net.b{}

a=sim(net,p)

%net.IW{}*p+net.b{}

p2=net.IW{}*p+net.b{}

a2=sign(p2)

a3=tansig(a2)

a4=purelin(a3)

net.b{}

net.b{}

net.IW{}

net.IW{}

0.7616+net.b{}

a-net.b{}

(a-net.b{})/ 0.7616

help purelin

p1=[;];

a5=sim(net,p1)

net.b{}

net=newff([- ; ],[,],{'tansig','purelin'},'traingd')

net.IW{}

net.b{}

%p=[;];

p=[;];

a=sim(net,p)

net=init(net);

net.IW{}

net.b{}

a=sim(net,p)

net.IW{}*p+net.b{}

p2=net.IW{}*p+net.b{}

a2=sign(p2)

a3=tansig(a2)

a4=purelin(a3)

net.b{}

net.b{}

P=[1.2;;0.5;1.6]

W=[0.3 0.6 0.1 0.8]

net1=newp([ ; ; ; ],,'purelin');

net2=newp([ ; ; ; ],,'logsig');

net3=newp([ ; ; ; ],,'tansig');

net4=newp([ ; ; ; ],,'hardlim');

net1.IW{}

net2.IW{}

net3.IW{}

net4.IW{}

net1.b{}

net2.b{}

net3.b{}

net4.b{}

net1.IW{}=W;

net2.IW{}=W;

net3.IW{}=W;

net4.IW{}=W;

a1=sim(net1,P)

a2=sim(net2,P)

a3=sim(net3,P)

a4=sim(net4,P)

init(net1);

net1.b{}

help tansig

p=[-0.1 0.5]

t=[-0.3 0.4]

w_range=-:0.4:;

b_range=-:0.4:;

ES=errsurf(p,t,w_range,b_range,'logsig');

pause(0.5);

hold off;

net=newp([-,],,'logsig');

net.trainparam.epochs=;

net.trainparam.goal=0.001;

figure();

[net,tr]=train(net,p,t);

title('动态逼近')

wight=net.iw{}

bias=net.b

pause;

close;

p=[-0.2 0.2 0.3 0.4]

t=[-0.9 -0.2 1.2 2.0]

h1=figure();

net=newff([-,],[,],{'tansig','purelin'},'trainlm');

net.trainparam.epochs=;

net.trainparam.goal=0.0001;

net=train(net,p,t);

a1=sim(net,p)

pause;

h2=figure();

plot(p,t,'*');

title('样本')

title('样本');

xlabel('Input');

ylabel('Output');

pause;

hold on;

ptest1=[0.2 0.1]

ptest2=[0.2 0.1 0.9]

a1=sim(net,ptest1);

a2=sim(net,ptest2);

net.iw{}

net.iw{}

net.b{}

net.b{}

matlab运行结果：

图：4

感知机算法及BP神经网络的更多相关文章

bp神经网络及matlab实现
本文主要内容包含: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 . 第0节.引例本文以Fisher的Iris数据集 ...
神经网络中的BP神经网络和贝叶斯
1 贝叶斯网络在地学中的应用 1 1.1基本原理及发展过程 1 1.2 具体的研究与应用 4 2 BP神经网络在地学中的应用 6 2.1BP神经网络简介 6 2.2基本原理 7 2.3 在地学中的具体 ...
BP神经网络与Python实现
人工神经网络是一种经典的机器学习模型,随着深度学习的发展神经网络模型日益完善. 联想大家熟悉的回归问题, 神经网络模型实际上是根据训练样本创造出一个多维输入多维输出的函数, 并使用该函数进行预测, 网 ...
Python语言编写BP神经网络
Python语言编写BP神经网络 2016年10月31日 16:42:44 ldy944758217 阅读数 3135 人工神经网络是一种经典的机器学习模型,随着深度学习的发展神经网络模型日益完善 ...
粒子群优化算法对BP神经网络优化 Matlab实现
1.粒子群优化算法粒子群算法(particle swarm optimization,PSO)由Kennedy和Eberhart在1995年提出,该算法模拟鸟集群飞行觅食的行为,鸟之间通过集体的协作 ...
神经网络和误差逆传播算法（BP）
本人弱学校的CS 渣硕一枚,在找工作的时候,发现好多公司都对深度学习有要求,尤其是CNN和RNN,好吧,啥也不说了,拿过来好好看看.以前看习西瓜书的时候神经网络这块就是一个看的很模糊的块,包括台大的视 ...
感知机和BP神经网络
一.感知机 1.感知机的概念感知机是用于二分类的线性分类模型,其输入是实例的特征向量,输出是实例的类别,类别取+1和-1二个值,+1代表正类,-1代表负类.感知机对应于输入空间(特征空间)中将实例分 ...
JAVA实现BP神经网络算法
工作中需要预测一个过程的时间,就想到了使用BP神经网络来进行预测. 简介 BP神经网络(Back Propagation Neural Network)是一种基于BP算法的人工神经网络,其使用BP算法 ...
数据挖掘系列（9）——BP神经网络算法与实践
神经网络曾经很火,有过一段低迷期,现在因为深度学习的原因继续火起来了.神经网络有很多种:前向传输网络.反向传输网络.递归神经网络.卷积神经网络等.本文介绍基本的反向传输神经网络(Backpropaga ...

随机推荐

关于H5的一些相关基础知识
HTML只是简写全写是(Hyper Text Markup Language)表示的是:超文本标记语言; HTML5表示的是html的第5次重大修改的第5个版本,(而html5是W3C和WHATWG ...
linux内存管理初学
虚拟内存模型 Linux 内核本身并不运行在虚拟空间中,其使用的是物理寻址模式. 物理内存被分割为界面,一个内存页面的大小由PAGE_SIZE宏决定. 虚拟地址空间的方式使程序员可以将巨大的结构用于连 ...
flex布局下img图片变形的解决方法
图片正常效果图片变形效果一.flex-shrink: 0 给 img 设置 flex-shrink: 0; flex-shrink 的默认值为1,如果没有显示定义该属性,将会自动按照默认值 ...
mongodb聚合查询-aggregate
Mongodb-aggregate 在工作中经常遇到一些mongodb的聚合操作,和mysql对比起来,mongo存储的可以是复杂的类型,比如数组,字典等mysql不善于处理的文档型结构,但是mong ...
js判断img是否存在
利用image对象的onerror事件来判断,出错则更换image对象的src为默认图片的URL. <p>第一种情况:图片存在,正常显示 <img src="http ...
清除keil编译中间文件的脚本
清除keil编译生成的中间文件,减小项目体积. keykill.bat del *.bak /s del *.ddk /s del *.edk /s del *.lst /s del *.lnp /s ...
利用setuptools发布Python程序到PyPI，为Python添砖加瓦
pip install的东西从哪里来的? 从PyPI (Python Package Index)来的,官网是: https://pypi.python.org/pypi/执行pip install ...
【tomcat】同一个服务器，搭建多个tomcat服务
1. 下载apache-tomcat-7.0.63,下载地址:http://tomcat.apache.org/download-70.cgi下载下来的文件为apache-tomcat-7.0.63. ...
web页面长时间未操作自动退出登录
var lastTime = new Date().getTime(); var currentTime = new Date().getTime(); * * ; //设置超时时间: 10分 $(f ...
正则的lastIndex 属性
简介:正则的lastIndex 属性用于规定下次匹配的起始位置. 注意: 该属性只有设置标志 g 才能使用. 上次匹配的结果是由方法 RegExp.exec() 和 RegExp.test() 找到的 ...

感知机算法及BP神经网络

感知机算法及BP神经网络的更多相关文章

随机推荐

热门专题