深度学习课程笔记（三）Backpropagation 反向传播算法

深度学习课程笔记（三）Backpropagation 反向传播算法

2017.10.06

材料来自：http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS17.html

反向传播算法这里是用到 chain rule（链式法则）的，如下图所示：

这个应该没什么问题。大家都学过的。

我们知道总的loss 是由各个小的 loss 组合得到的，那么我们在求解 Loss 对每一个参数的微分的时候，只要对每一个 loss 都这么算就可以了。那么我们以后的例子都是以 loss 的为基础而来的。

这里我们的反向传播，主要依赖于前向传播和反向传播，其loss的计算也是依赖于链式法则：

有了上面 z 的表达式，我们分别对 w1 和 w2 进行求导，我们可以得到对应的结果，分别为： x1 and x2。其实就是连接权重的输入。

那么，很直观的，我们可以得到如下的结果：

OK，现在我们求解出其中的一项了，那么，另外一项该怎么算呢？我们接着看：

这里的激活函数 a，我们用的 sigmoid，当然也可以是其他的函数了。我们对该激活函数进行求导，可以得到其微分，这个就是该项的左侧部分，那么右侧该怎么算呢？

我们知道，后面有可能又有很多的 layer，该结果可能影响后面所有的值。我们假设这里只有 2 个神经元，那么我们可以得到：

我们将右边那一项按照链式法则展开后，可以发现，又是这样子，输出对变量求导后就是输入，所以，展开后的两项的稀疏，都是已知的输入，即：w3 and w4。那么另外两项分别是什么呢？其实这个又是和后续有关的，这里我们假设这些值是已知的，那么我们就可以算出右侧的值了。

那么 l 对 z 求偏导之后的值，我们可以计算出来：

这里，其实有两种情况：

1. 此处是最后一层，那么我们就可以直接计算就行了：

2. 若不是最后一层呢？我们只要将后面计算出的值，带入到这里就行了。

以上部分，是从输入端开始算起，所以每次都会遇到利用后面的值的问题，貌似计算量很大啊。。怎么办？

其实，没必要的啦，我们可以后面向前算，我们知道了后面的 loss，我们去求前一层的各种偏导数，然后依次向前算，就可以得到整个网络的各个偏导数的值啦。。。。

也就是说：

所以，这个过程其实就是反向传播算法啦。。。总结一下：

通过这样子的方法，我们得到了其偏微分，其实就是梯度啦。。。根据梯度下降的方法，我们就可以更改权重，使得 loss 最小，从而就完成了神经网络的训练。。。。

深度学习课程笔记（三）Backpropagation 反向传播算法的更多相关文章

深度学习课程笔记（十五）Recurrent Neural Network
深度学习课程笔记(十五)Recurrent Neural Network 2018-08-07 18:55:12 This video tutorial can be found from: Yout ...
深度学习课程笔记（七）：模仿学习（imitation learning）
深度学习课程笔记(七):模仿学习(imitation learning) 2017.12.10 本文所涉及到的模仿学习,则是从给定的展示中进行学习.机器在这个过程中,也和环境进行交互,但是,并没有显 ...
深度学习课程笔记（十一）初探 Capsule Network
深度学习课程笔记(十一)初探 Capsule Network 2018-02-01 15:58:52 一.先列出几个不错的 reference: 1. https://medium.com/ai% ...
深度学习课程笔记（四）Gradient Descent 梯度下降算法
深度学习课程笔记(四)Gradient Descent 梯度下降算法 2017.10.06 材料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS1 ...
深度学习课程笔记（二）Classification： Probility Generative Model
深度学习课程笔记(二)Classification: Probility Generative Model 2017.10.05 相关材料来自:http://speech.ee.ntu.edu.tw ...
深度学习课程笔记（一）CNN 卷积神经网络
深度学习课程笔记(一)CNN 解析篇相关资料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html 首先提到 Why CNN for I ...
深度学习课程笔记（十八）Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE
深度学习课程笔记(十八)Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE 201 ...
深度学习课程笔记（十七）Meta-learning (Model Agnostic Meta Learning)
深度学习课程笔记(十七)Meta-learning (Model Agnostic Meta Learning) 2018-08-09 12:21:33 The video tutorial can ...
深度学习课程笔记（十六）Recursive Neural Network
深度学习课程笔记(十六)Recursive Neural Network 2018-08-07 22:47:14 This video tutorial is adopted from: Youtu ...

随机推荐

XML系列之--创建电文格式的XML（一）
关于XML,学校那会,老师在口中仅仅提及,自己也未曾深入接触过,仅是些将最基本XML文件内容显示在web定义的表格中之类的简单操作,如今项目中的收发电文涉及到复杂XML的操作.趁此契机好好回顾下XML ...
Linux基础命令---显示路由表route
route route指令用于显示或者修改IP路由表.它的主要用途是在使用ifconfig(8)程序配置接口后,通过接口设置到特定主机或网络的静态路由.当使用add或del选项时,路由将修改路由表.如 ...
localStorage过期策略
localStorage过期策略由于html5没有给本地存储设置过期策略,那么在处理数据的过期策略的时候可以编写自己过期策略程序,如下: <!DOCTYPE> <head> ...
图像处理基础---RGB图灰度图索引图调色板
(1)二进制图在二进制图中,像素的取值为两个离散数值0或1中的一个,0代表黑色,1代表白色例 A=[0 0 1;1 1 0; 0 0 1];>> imshow(A,'InitialMa ...
Java学习技术分享：Java中的原子操作
学习java需要有一套完整的学习线路,需要有条理性,当下学习java已经有一段时间了,由当初的懵逼状态逐渐好转,也逐渐养成了写技术学习笔记的习惯,今天总结了一下java中的原子操作. 1.Java中的 ...
监控MySQL主从脚本
示例一: cat check_mysql_health #!/bin/sh slave_is=($(mysql -S /tmp/mysql3307.sock -uroot -e "show ...
js 简易时钟
html部分 <div id="clock"> </div> css部分 #clock{ width:600px ; text-align: center; ...
mysql复习之一
DROP DATABASE mysql_shiyan;. cd /home/shiyanlou/Desktop git clone https://github.com/shiyanlou/SQL4 ...
python selenium chrome有界面与无界面模式
from selenium.webdriver.chrome.options import Options from selenium import webdriver # 无界面模式 def Chr ...
Nginx和PHP上传文件大小的限制
Nginx client_max_body_size 80m; PHP php.ini file_uploads = on ; 是否允许通过HTTP上传文件的开关.默认为ON即是开 upload_tm ...

深度学习课程笔记（三）Backpropagation 反向传播算法

深度学习课程笔记（三）Backpropagation 反向传播算法的更多相关文章

随机推荐

热门专题