Feedforward and BackPropagation Algorithm

在下图所示的Neural Network中，我们将拥有三个节点的layer1及layer4分别称为输入和输出层，而中间的两层layer2,layer3称为隐藏层(hidden layer)。输入数据X，从左侧进入神经网络，经过层层传播最终从右侧输出的过程，称为Feedforward。而根据training set来调整参数的算法，称为Backpropagation Algorithm，即反向传播算法。

在Hidden layer的每个Node中，都存在一个non-linear unit，常用的是有tanh,sigmoid以及ReLu等。如果没有non-linear unit，则无论NN的architecture如何，输出将永远是输入数据的线性组合，Neural Network也就失去了意义。

首先我们约定weight的表达方式如下图所示：

每个节点的左侧输入值z等于：

每个节点的右侧输出值a等于在其输入值z的基础上，施加非线性可微函数σ

假设Neural Network总共有L层，则会有L-1个ω矩阵存在，所以ω矩阵的维度是size(ω)=q*p,其中q为下一层的节点数，p为本层的节点数。在上图的Layer3中，w³为如下的2x4的矩阵形式：

如果将Feedforward propagation的过程矩阵化，则可以写为：

下面来看如何使用Backpropagation更新ω呢。Backpropagation其实是Gradient Descent的一种拓展，如果我们能够拿到cost function对某个ω的梯度值，那么我们就可以对其做梯度下降并迭代求出最优结果。更新算法见：线性回归与梯度下降

为了说明方便，一般会定义一个δ作为某一个节点输入端的误差（即z值的误差）:

矩阵化后：

我们可以根据上式，直接算出最后一层的δ值，但是对于任意一层、任意一个节点的δ，则需要将最后一层的误差值进行层层传导，其公式为：

矩阵化后，任意一层的节点误差矩阵为

而我们最终的目的在于求得w的梯度，从而利用gradient descent去更新参数，对于任意一层l的某条路径j,k，我们有：

对任意一层l的所有weight，我们有：

对于第l层bias处的梯度：

Feedforward and BackPropagation Algorithm的更多相关文章

CheeseZH: Stanford University: Machine Learning Ex4:Training Neural Network(Backpropagation Algorithm)
1. Feedforward and cost function; 2.Regularized cost function: 3.Sigmoid gradient The gradient for t ...
BP反向传播算法的工作原理How the backpropagation algorithm works
In the last chapter we saw how neural networks can learn their weights and biases using the gradient ...
反向传播算法 Backpropagation Algorithm
假设我们有一个固定样本集,它包含个样例.我们可以用批量梯度下降法来求解神经网络.具体来讲,对于单个样例(x,y),其代价函数为:这是一个(二分之一的)方差代价函数.给定一个包含个样例的数据集,我们 ...
The Backpropagation Algorithm
https://page.mi.fu-berlin.de/rojas/neural/chapter/K7.pdf 7.1 Learning as gradient descent We saw in ...
神经网络(9)--如何求参数: backpropagation algorithm(反向传播算法)
Backpropagation algorithm(反向传播算法) Θij(l) is a real number. Forward propagation 上图是给出一个training examp ...
[Converge] Backpropagation Algorithm
Ref: CS231n Winter 2016: Lecture 4: Backpropagation Ref: How to implement a NN:中文翻译版本 Ref: Jacobian矩 ...
一文弄懂神经网络中的反向传播法(Backpropagation algorithm)
最近在看深度学习的东西,一开始看的吴恩达的UFLDL教程,有中文版就直接看了,后来发现有些地方总是不是很明确,又去看英文版,然后又找了些资料看,才发现,中文版的译者在翻译的时候会对省略的公式推导过程进 ...
(六) 6.2 Neurons Networks Backpropagation Algorithm
今天得主题是BP算法.大规模的神经网络可以使用batch gradient descent算法求解,也可以使用 stochastic gradient descent 算法,求解的关键问题在于求得每层 ...
吴恩达机器学习笔记30-神经网络的反向传播算法（Backpropagation Algorithm）
之前我们在计算神经网络预测结果的时候我们采用了一种正向传播方法,我们从第一层开始正向一层一层进行计算,直到最后一层的ℎ

随机推荐

本地部署 Misago Docker + 配置 HTTPS 笔记
最近答应帮朋友做个论坛网站,想借此机会捡起 Python 在 GitHub 找了一圈,打算借用以 Python+Django 开发的 Misago 这个论坛系统由于作者在今年更新的 Misago 0 ...
P5443 [APIO2019]桥梁
传送门子任务 $4$ 告诉我们可以离线搞带权并查集从大到小枚举询问,从大到小连边如果没有修改操作就可以过了但是有修改,考虑最暴力的暴力,搞可撤销并查集同样先离线,从大到小处理询问时,按原边权 ...
NancyFx框架之检测任务管理器
先建一个空的项目和之前的NancyFx系列一样的步骤然后建三个文件夹Models,Module,Views 然后分别安装一下组件 jQuery Microsoft.AspNet.SignalR Mi ...
Scala本地安装
一.下载 https://www.scala-lang.org/download/ 这里我选择Scala2.10.4版本二.安装安装比较简单和jdk类似点击一路安装: 选择自己的路径完成 ...
eclipse hibernate配置文件（*.hbm.xml）加上自动提示功能
转自:https://blog.csdn.net/u012217085/article/details/17397843?utm_source=blogkpcl3 1. 标签:hibernate 在编 ...
5-基于TMS320C6678+XC7K325T的6U CPCIe高性能处理平台
基于TMS320C6678+XC7K325T的6U CPCIe高性能处理平台一.板卡概述本板卡系自主研发,基于CPCI 6U架构,符合CPCI2.0标准.采用 DSP TMS320C66 ...
二、搭建Swagger
1.新建.netCore webapi项目 2.安装swagger ,通过 Package Manager 控制台:Install-Package Swashbuckle.AspNetCore 3.修 ...
python3-sorted
排序也是在程序中经常用到的算法.无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小.如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比 ...
修改编码为utf8mb4 以支持emoji表情
环境: 项目db的所有字符集都已经初始化为utf-8,如 status命令显示如下: Server characterset: utf8Db characterset: utf8Client char ...
【串线篇】spring boot对静态资源的映射规则
WebMvcAutoConfiguration的内部类 WebMvcAutoConfigurationAdapter 其中ResourceProperties点进去其中addResourceHand ...

Feedforward and BackPropagation Algorithm

Feedforward and BackPropagation Algorithm的更多相关文章

随机推荐

热门专题