Deep Learning 学习笔记（7）：神经网络的求解与反向传播算法（Back Propagation）

反向传播算法（Back Propagation）：

引言：

在逻辑回归中，我们使用梯度下降法求参数方程的最优解。

这种方法在神经网络中并不能直接使用，

因为神经网络有多层参数（最少两层），（？为何不能）

这就要求对梯度下降法做少许改进。

实现过程：

一、正向传播

首先，同逻辑回归，我们求出神经网络输出与实际值的“误差”——COST：

这里先使用欧式距离而不是索夫曼函数作为输出的cost：

展开之后：

（注意右边的权重衰减项，既规则化）

二、反向传播

对于第层（输出层）的每个输出单元，我们根据以下公式计算残差：

对的各个层，第层的第个节点的残差计算方法如下

这里：

这里相当于把本层节点的残差按照权重“投影”到上一层残差的节点上（“反向传播”就是这个意思）

在计算出各节点的残差之后，参数的偏导如下计算：

然后就可以梯度下降去了！

梯度下降过程：

1、进行前馈计算，求的所有节点的输出，求得cost；

2、进行反向传播计算，求的所有节点残差（第nl ~ 第2层）

3、利用公式求得cost对参数的偏导

4、更新偏导。

5、重复1~4知道cost差距小于预设值或重复次数大于预设值

（这里以上只讲实现方法，省略所有证明。相关证明贴于最后。）

随机初始化（ Random Initialization）：

在进行第一次前馈算法之前，神经网络参数的值是多少呢？

全零初始化？这是不可以的！

如果选择相同的参数进行初始化，

隐藏节点的出入必定相同（自己推推，更不用说输出了）。

为了使得对称失效，我们对神经网络的参数进行随机初始化，

既采用接近零的初始值进行初始化。

这个过程可以用matlab产生随机矩阵的功能来实现。

初始化之后，让我们一起下降吧！

用到的证明（残差的计算）：

1、

2、

Deep Learning 学习笔记（7）：神经网络的求解与反向传播算法（Back Propagation）的更多相关文章

Neural Networks and Deep Learning学习笔记ch1 - 神经网络
近期開始看一些深度学习的资料.想学习一下深度学习的基础知识.找到了一个比較好的tutorial,Neural Networks and Deep Learning,认真看完了之后觉得收获还是非常多的. ...
【deep learning学习笔记】注释yusugomori的DA代码 --- dA.h
DA就是“Denoising Autoencoders”的缩写.继续给yusugomori做注释,边注释边学习.看了一些DA的材料,基本上都在前面“转载”了.学习中间总有个疑问:DA和RBM到底啥区别 ...
Deep Learning 学习笔记（8）：自编码器( Autoencoders )
之前的笔记,算不上是 Deep Learning, 只是为理解Deep Learning 而需要学习的基础知识, 从下面开始,我会把我学习UFDL的笔记写出来 #主要是给自己用的,所以其他人不一定看得 ...
paper 149:Deep Learning 学习笔记（一）
1. 直接上手篇台湾李宏毅教授写的,<1天搞懂深度学习> slideshare的链接: http://www.slideshare.net/tw_dsconf/ss-62245351? ...
深度学习——深度神经网络（DNN）反向传播算法
深度神经网络(Deep Neural Networks,简称DNN)是深度学习的基础. 回顾监督学习的一般性问题.假设我们有$m$个训练样本$\{(x_1, y_1), (x_2, y_2), …, ...
深度神经网络（DNN）反向传播算法(BP)
在深度神经网络(DNN)模型与前向传播算法中,我们对DNN的模型和前向传播算法做了总结,这里我们更进一步,对DNN的反向传播算法(Back Propagation,BP)做一个总结. 1. DNN反向 ...
Deep Learning 学习笔记（6）：神经网络( Neural Network )
神经元: 在神经网络的模型中,神经元可以表示如下神经元的左边是其输入,包括变量x1.x2.x3与常数项1, 右边是神经元的输出神经元的输出函数被称为激活函数(activation function ...
[置顶] Deep Learning 学习笔记
一.文章来由好久没写原创博客了,一直处于学习新知识的阶段.来新加坡也有一个星期,搞定签证.入学等杂事之后,今天上午与导师确定了接下来的研究任务,我平时基本也是把博客当作联机版的云笔记~~如果有写的不 ...
【deep learning学习笔记】Recommending music on Spotify with deep learning
主要内容: Spotify是个类似酷我音乐的音乐站点.做个性化音乐推荐和音乐消费.作者利用deep learning结合协同过滤来做音乐推荐. 详细内容: 1. 协同过滤基本原理:某两个用户听的歌曲 ...

随机推荐

JDBC相关总结
JDBC statement的相关总结 1.Statement.PreparedStatement和CallableStatement都是接口(interface). 2.Statement继承自Wr ...
angular js jquery中post请求的一点小区别
这也是最近遇到的坑,还是之前那个项目,现在要实现登录功能. 背景:注册功能之前已经跑通了.前端用的是jquery后台是springMVC.鉴于注册和登录有些接口功能是类似的(比如注册确保邮箱是没有注册 ...
LeetCode OJ：Add Digits（数字相加）
Given a non-negative integer num, repeatedly add all its digits until the result has only one digit. ...
jsp转发和重定向
response应答 a) Response.sendRedirect(路径); //重定向 b) Response.getRequestDispatcher(路径).forward(request, ...
《Unity 3D游戏客户端基础框架》概述
框架概述: 做了那么久的业务开发,也做了一年多的核心战斗开发,最近想着自己倒腾一套游戏框架,当然暂不涉及核心玩法类型和战斗框架,核心战斗的设计要根据具体的游戏类型而定制,这里只是一些通用的基础系统的框 ...
Unity中使用柏林噪声生成地图
孙广东 2017.3.27 http://blog.csdn.NET/u010019717 主要是利用Unity的 Mathf.PerlinNoise 函数(柏林噪声)的不同寻常的功能. htt ...
asp.net identity的学习记录
# identity数据库 ## 创建空数据库交给ef管理 ### 添加asp.net identity包 ``` Install-Package Microsoft.AspNet.Identity ...
深入了解ZooKeeper（一）
在上篇博客ZooKeeper初探之安装和配置中已经对Zookeeper这个“服务协调者”有了初步的认识和了解,一个字“美”,接下来开始深入的交往,开始了解其内心世界! 1. 内容思维导图 2. 分布式 ...
The last packet sent successfully to the server was 0 milliseconds ago
出现异常”The last packet sent successfully to the server was 0 milliseconds ago.“的大部分原因是由于数据库回收了连接,而系统的缓 ...
复制的web工程为什么不能部署到tomcat
An existing resource has been found at location D:\apache-tomcat-6.0.18\apache-tomcat-6.0.18\webapps ...

Deep Learning 学习笔记（7）：神经网络的求解 与 反向传播算法（Back Propagation）

Deep Learning 学习笔记（7）：神经网络的求解 与 反向传播算法（Back Propagation）的更多相关文章

随机推荐

热门专题

Deep Learning 学习笔记（7）：神经网络的求解与反向传播算法（Back Propagation）

Deep Learning 学习笔记（7）：神经网络的求解与反向传播算法（Back Propagation）的更多相关文章