《全连接的BP神经网络》

本文主要描述全连接的BP神经网络的前向传播和误差反向传播，所有的符号都用Ng的Machine learning的习惯。下图给出了某个全连接的神经网络图。

1前向传播

1.1前向传播

分别计算第l层神经元的输入和输出；

1.1.1偏执项为1时

向量整体形式：

分量形式：

1.1.2偏执项为b时

向量整体形式：

分量形式：

1.2网络误差

1.2.1偏执项为1时

对于某一个输入样本，它的输出为，它所对应的真实输出应该为，那么，该样本对应的误差E为

（1）

注意到输出层的第k个神经元的输出可以计算如下：

（2）

那么，误差E可以展开至隐藏层(第L-1层)的形式

（3）

又注意到隐藏层(第L-1层)的第j个神经元的输出可以计算如下：

(4)

那么，误差E进一步展开至隐藏层(第L-2层)

(5)

可以发现，E是权值的函数。

1.2.2偏执项为b时

对于某一个输入样本，它的输出为，它所对应的真实输出应该为，那么，该样本对应的误差E为

(6)

注意到输出层的第k个神经元的输出可以计算如下：

(7)

那么，误差E可以展开至隐藏层(第L-1层)的形式

(8)

又注意到隐藏层(第L-1层)的第j个神经元的输出可以计算如下：

(9)

那么，误差E进一步展开至隐藏层(第L-2层)

(10)

可以发现，E是权值和偏执项的函数。

2误差反向传播中的敏感度

某一层的敏感度的定义为：网络的误差对该层的输入的偏导数，即

2.1偏执项为1时的敏感度

2.1.1输出层的敏感度

输出层（第L层）的第k个神经元的敏感度定义如下：

为了计算该敏感度，利用链式法则，引入中间变量（第L层的第k个神经元的输出）：

(11)

首先，计算：

然后，计算：

这里的f为sigmoid函数，有：

从而可以得到：

(12)

那么，第L层的所有神经元的敏感度为：

(13)

2.1.2其他层

计算第L-1层的第j个神经元的敏感度，定义如下：

为了计算该敏感度，利用链式法则，引入中间变量（第L-1层的第j个神经元的输出）：

(14)

首先，计算：

其中：

则有：

然后，计算：

从而可以得到：

(15)

其中：

那么，第L-1层的所有神经元的敏感度为

(16)

以上推导是由第L层的敏感度计算第L-1层的敏感度，那么，利用递推方法可以得到第l层的敏感度的计算方法（l=L-1,…,2）：

(17)

2.2偏执项为b时的敏感度

推导过程中，只有一处发生改变，即隐藏层的计算式发生如下改变，但结果并没有改变，所以不会对最终的敏感度的计算公式造成影响：

3梯度的计算

3.1单个样本（偏执项为1时）的梯度

此时的待优化参数只有权值矩阵中的元素，计算误差E对第l层的权值矩阵的偏导数：

对于其中的某一个元素，计算如下：

那么，整个求导矩阵计算如下：

即：

3.2单个样本（偏执项为b时）的梯度

此时的待优化参数为权值矩阵中的元素和偏执项b；

首先计算误差E对第l层的权值矩阵的偏导数：

对于其中的某一个元素，计算如下：

那么，整个求导矩阵计算如下：

接下来，计算误差E对第l层的偏执项矩阵的偏导数：

对于其中的某一个元素，计算如下：

所以，整个偏执项求得到计算如下：

3.3m个样本的梯度求解（未加入其他惩罚项）

如前所述，对于单个样本而言，它的代价函数为E，现在有m个训练样本，它的代价函数应该为所有样本的代价函数的均值，用E_i表示第i个训练样本的代价函数（也就是前文一直使用的代价函数），E表示所有样本的代价函数，则它们有如下关系：

则有：

(18)

如果有偏执项b的话，则有

(19)

如果有m个样本，前面计算所得得到的和都是矩阵，它们的每一列是每个样本对应的第l层的敏感度和输出值。那么，可以按照如下方式计算m个样本所对应的梯度值：

（1）偏执项为1

(20)

（2）偏执项为b

(21)

(22)

4加了正则化项和稀疏项后

4.1网络误差

加入了正则化项和稀疏项后的网络误差计算公式如下：

(23)

其中：

J₁、J₂和J₃的计算方法分别如下：

第k个隐藏层中j个神经元的相对熵的计算公式如下：

(24)

其中：，为第k个隐藏层中j个神经元相对于第i个输入样本的激励值，而为第k个隐藏层中j个神经元相对于所有输入样本激励值的均值。

4.2网络代价函数的偏导数

网络代价函数的偏导数：

其中：

（1）偏执项为1时

(25)

（2）偏执项为b时

(26)

4.3敏感度的计算

加入了权值惩罚项和稀疏项后，输出层的敏感度计算不发生变化，而其余各层的敏感度公式变为如下：

(27)

5计算流程

利用前向传播算法计算各层的激励值
计算整个网络的代价函数

利用式 (23)
利用反向传播算法计算各层的敏感度
计算代价函数对权值矩阵和偏执项的梯度

利用式(26)计算代价函数对权值矩阵和偏执项的梯度

全连接的BP神经网络的更多相关文章

直观理解神经网络最后一层全连接+Softmax
目录写在前面全连接层与Softmax回顾加权角度模板匹配几何角度 Softmax的作用总结参考博客:blog.shinelee.me | 博客园 | CSDN 写在前面这篇文章将从3 ...
RBF神经网络和BP神经网络的关系
作者:李瞬生链接:https://www.zhihu.com/question/44328472/answer/128973724来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...
TensorFlow------单层(全连接层)实现手写数字识别训练及测试实例
TensorFlow之单层(全连接层)实现手写数字识别训练及测试实例: import tensorflow as tf from tensorflow.examples.tutorials.mnist ...
全连接BP神经网络
前馈神经网络前馈神经网络(feedforward neural network)是最朴素的神经网络,通常我们所说的前馈神经网络有两种,一种叫反向传播网络(Back propagation Netwo ...
TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断)
在上一篇博客<TensorFlow之DNN(一):构建“裸机版”全连接神经网络>中,我整理了一个用TensorFlow实现的简单全连接神经网络模型,没有运用加速技巧(小批量梯度下降不算哦) ...
TensorFlow之DNN（一）：构建“裸机版”全连接神经网络
博客断更了一周,干啥去了?想做个聊天机器人出来,去看教程了,然后大受打击,哭着回来补TensorFlow和自然语言处理的基础了.本来如意算盘打得挺响,作为一个初学者,直接看项目(不是指MINIST手写 ...
MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 在前两篇文章MINIST深度学习识别:python全连接神经网络和pytorch LeNet CNN网 ...
基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络
包含一个隐含层的全连接神经网络结构如下: 包含一个隐含层的神经网络结构图以MNIST数据集为例,以上结构的神经网络训练如下: #coding=utf-8 from tensorflow.exampl ...
Python3 卷积神经网络卷积层，池化层，全连接层前馈实现
# -*- coding: utf-8 -*- """ Created on Sun Mar 4 09:21:41 2018 @author: markli " ...

随机推荐

JSP&Servlet学习手册
JSP&Servlet学习手册沙琪玛书目录 JSP 指令... 3 书写方式... 3 指令列表... 3 JSP 内置对象... 3 内置对象特点... 3 常用内置对象... 3 o ...
Can't connect to MySQL server on localhost (10061)解决方法
出现这种错误的原因是由于MySQL的服务被关闭的原因,重新启动一下服务就可以了,启动服务的操作如下: 右键[计算机]-[管理]
the Linux Kernel: Traffic Control, Shaping and QoS
−Table of Contents Journey to the Center of the Linux Kernel: Traffic Control, Shaping and QoS 1 Int ...
Android 动画及属性动画
Android 平台提供了一套完整的动画框架,在Android3.0之前有两种动画Tween Animation(补间动画)和Frame Animation(帧动画), 对应SDK中的View Ani ...
js中的这些距离你知道吗？
在picture library中取某一图片的大图、小图
public static string GetPicThumbnail(SPFile file, string type) { string thumbnail = "" ...
Linux中解决SSH连接慢问题
[转载]来源:http://www.bkjia.com/xtzh/893669.html [转载原因]:其他文章都是修改服务器端配置,但为了保证服务器端安全问题,一般情况下最好不要修改服务器端配置.因 ...
Java--获取request中所有参数的方法
我们通常用到request获取某个参数的方法: String value=request.getparameter("key"); 如果想要获取request中所有的参数呢? re ...
OC基础-day05
#pragma mark - Day05_01_NSObject类 NSObject类 1). NSObject是Foundation框架中的1个类. 在这个类中有1个类方法,叫做new 这个方法的作 ...
（转）iOS被开发者遗忘在角落的NSException-其实它很强大
转载自 http://www.jianshu.com/p/05aad21e319e iOS被开发者遗忘在角落的NSException-其实它很强大字数597 阅读968 评论4 喜欢28 NSExc ...

全连接的BP神经网络

1前向传播

1.1前向传播

1.1.1偏执项为1时

1.1.2偏执项为b时

1.2网络误差

1.2.1偏执项为1时

1.2.2偏执项为b时

2误差反向传播中的敏感度

2.1偏执项为1时的敏感度

2.1.1输出层的敏感度

2.1.2其他层

2.2偏执项为b时的敏感度

3梯度的计算

3.1单个样本（偏执项为1时）的梯度

3.2单个样本（偏执项为b时）的梯度

3.3m个样本的梯度求解（未加入其他惩罚项）

4加了正则化项和稀疏项后

4.1网络误差

4.2网络代价函数的偏导数

4.3敏感度的计算

5计算流程

全连接的BP神经网络的更多相关文章

随机推荐

热门专题