反向传播 Backpropagation

前向计算：没啥好说的，一层一层套着算就完事了 y = f( ... f( W_layer2^Tf( W_layer1^Tx ) ) )

反向求导：链式法则

单独看一个神经元的计算，z (就是logit）对 w_i 的偏微分等于 x_i ：

再看多层的情况，z 经过激活函数得到 a，而 a 在下一层和 w₃ 、w₄都进行了计算。所以 C 对 z 求偏微分的话，根据链式法则这两条参数的路径都要去找，且 z' 对 a 的偏微分等于w₃，z'' 对 a 的偏微分等于w₄：

到这里重点来了，想象有一个不存在神经元，做的计算跟上面这个式子一样，那差不多就是下图这样，z 已经在之前就计算出来了

最后，就差两项偏微分没有计算出来，两种情况：

1. 当前就已经是output layer了，那就直接算

完事了

2. 还不是output layer

继续跟刚才的 backward pass 一样计算，一直找到最后

所以有没有真正理解什么是反向传播？

其实跟前向传播的计算并没有很大区别，实际上可以理解为：假设存在一个神经元是放大器的反向网络进行计算，而且weight是一样的。

先算最后一层的偏微分，再一路往前面的层推过去，由于 sigmoid 函数的求导性质，所有反向计算需要的算子都是前向计算过程中已经算过的。（所以前向计算的时候每一层的结果都找个 list 先存一下）

反向传播 Backpropagation的更多相关文章

反向传播BackPropagation
http://www.cnblogs.com/charlotte77/p/5629865.html http://www.cnblogs.com/daniel-D/archive/2013/06/03 ...
如何理解反向传播 Backpropagation 梯度下降算法要点
http://colah.github.io/posts/2015-08-Backprop/ http://www.zhihu.com/question/27239198 待翻译 http://blo ...
[DeeplearningAI笔记]序列模型1.3-1.4循环神经网络原理与反向传播公式
5.1循环序列模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.3循环神经网络模型为什么不使用标准的神经网络假如将九个单词组成的序列作为输入,通过普通的神经网网络输出输出序列, 在 ...
【原】Coursera—Andrew Ng机器学习—编程作业 Programming Exercise 4—反向传播神经网络
课程笔记 Coursera—Andrew Ng机器学习—课程笔记 Lecture 9_Neural Networks learning 作业说明 Exercise 4,Week 5,实现反向传播 ba ...
CNN反向传播更新权值
背景反向传播(Backpropagation)是训练神经网络最通用的方法之一,网上有许多文章尝试解释反向传播是如何工作的,但是很少有包括真实数字的例子,这篇博文尝试通过离散的数据解释它是怎样工作的. ...
递归神经网络（RNN，Recurrent Neural Networks)和反向传播的指南 A guide to recurrent neural networks and backpropagation（转载）
摘要这篇文章提供了一个关于递归神经网络中某些概念的指南.与前馈网络不同,RNN可能非常敏感,并且适合于过去的输入(be adapted to past inputs).反向传播学习(backprop ...
[2] TensorFlow 向前传播算法(forward-propagation)与反向传播算法(back-propagation)
TensorFlow Playground http://playground.tensorflow.org 帮助更好的理解,游乐场Playground可以实现可视化训练过程的工具 TensorFlo ...
深度学习课程笔记（三）Backpropagation 反向传播算法
深度学习课程笔记(三)Backpropagation 反向传播算法 2017.10.06 材料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS1 ...
Deep Learning基础--随时间反向传播（BackPropagation Through Time，BPTT）推导
1. 随时间反向传播BPTT(BackPropagation Through Time, BPTT) RNN(循环神经网络)是一种具有长时记忆能力的神经网络模型,被广泛用于序列标注问题.一个典型的RN ...

随机推荐

生产Server遭挖矿程序入侵，暴力占用CPU
区块链的火热,利益驱使必然导致不少PC或Server,被变成肉鸡,执行挖矿程序进行挖矿,进而导致我们正常的程序无法正常. (Centos7 Server)使用top命令查看服务器进程运行情况,发现几个 ...
java三大集合遍历
1. 场景描述今天需要用到map集合遍历,一下子忘记咋写了,以前一般用map.get()直接获取值,很少遍历map,刚好总结下java中常用的几个集合-map,set,list遍历. 2. 解决方案 ...
springmvc上传文件踩过的坑
@RequestMapping("/addTweet") public String addTweet(TweetVO tweetVO, HttpServletRequest re ...
C程序中可怕的野指针
一.疑问点指针是C语言一个很强大的功能,同时也是很容易让人犯错的一个功能,用错了指针,轻者只是报个错,重者可能整个系统都崩溃了.下面是大家在编写C程序时,经常遇到的一种错误的使用方法,也许在你的学习和 ...
20141126-DotNetStack
SSH框架，xml配置实现动态定时器
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE beans PUBLIC "-// ...
Android解决RecyclerView中的item显示不全方案
最近的项目中实现订单确定页面.需要使用ScrollView嵌套RecyclerView,当RecyclerView中的item数量比较多时,就会出现item只显示一部分数据,并没有将用户勾选的商品数量 ...
Codeforces1144B(B题）Parity Alternated Deletions
B. Parity Alternated Deletions Polycarp has an array aa consisting of nn integers. He wants to play ...
python常用函数进阶(2)之map,filter,reduce,zip
Basic Python : Map, Filter, Reduce, Zip 1-Map() 1.1 Syntax # fun : a function applying to the iterab ...
SSM框架实现原理图（转）

反向传播 Backpropagation

反向传播 Backpropagation的更多相关文章

随机推荐

热门专题