第一节，windows和ubuntu下深度学习theano环境搭建

假设一个三层的神经网络结构图如下：

对于一个单独的训练样本x其二次代价函数可以写成：

C = 1/2|| y - a^L||² = 1/2∑_j(y_j - a_j^L)²

a_j^L=σ(z_j^L)

z_j^l = ∑_kω_jk^la_k^l-1 + b_j^l

代价函数C是a_j^L的函数，a_j^L又是z_j^L的函数，z_j^L又是ω_jk^L的函数，同时又是a_k^L-1的函数......

证明四个基本方程(BP1-BP4)，所有这些都是多元微积分的链式法则的推论

δ_j^L = (∂C/∂a_j^L)σ'(z_j^L) (BP1)

δ_j^l = ∑_kω_kj^l+1δ_k^l+1σ'(z_j^l) (BP2)

　　　 ∂C/∂ω_jk^l= δ_j^la_k^l-1(BP3)

∂C/∂b_j^l= δ_j^l(BP4)

1.让我们从方程(BP1)开始，它给出了输出误差δ^L的表达式。

δ_j^L = ∂C/∂z_j^L

应用链式法则，我们可以就输出激活值的偏导数的形式重新表示上面的偏导数：

δ_j^L = ∑_k(∂C/∂a_k^L)(∂a_k^L/∂z_j^L)

这里求和是在输出层的所有神经元k上运行的，当然，第k^th个神经元的输出激活值a_k^L只依赖于当k=j时第j^th个神经元的带权输入z_j^L。所以当k≠j

时，∂a_k^L/∂z_j^L=0。结果简化为：

δ_j^L = (∂C/∂a_j^L)(∂a_j^L/∂z_j^L)

由于a_j^L=σ(z_j^L)，右边第二项可以写成σ'(z_j^L)，方程变成

δ_j^L = (∂C/∂a_j^L)σ‘(z_j^L)

2.证明BP2，它给出了下一层误差δ^l+1的形式表示误差δ^l。为此我们要以δ_k^l+1=∂C/∂z_k^l+1的形式重写 δ_j^l = ∂C/∂z_j^l

δ_j^l = ∂C/∂z_j^l

=∑_k(∂C/∂z_k^l+1)(∂z_k^l+1/∂z_j^l)

=∑_k(∂z_k^l+1/∂z_j^l)δ_k^l+1

这里最后一行我们交换了右边的两项，并用δ_k^l+1的定义带入。为此我们对最后一行的第一项求值，

注意：

z_k^l+1 = ∑_jω_kj^l+1a_j^l + b_k^l+1 = ∑_jω_kj^l+1σ(z_j^l) + b_k^l+1

做微分得到

∂z_k^l+1 /∂z_j^l = ω_kj^l+1σ'(z_j^l)

带入上式:

δ_j^l = ∑_kω_kj^l+1δ_k^l+1σ'(z_j^l)

3.证明BP3。计算输出层∂C/∂ω_jk^L：

∂C/∂ω_jkL = ∑_m (∂C/∂a_m^L)(∂a_m^L/∂ω_jk^L )

这里求和是在输出层的所有神经元k上运行的，当然，第k^th个神经元的输出激活值a_m^L只依赖于当m=j时第j^th个神经元的输入权重ω_jk^L。所以当k≠j

　时，∂a_m^L/∂ω_jk^L=0。结果简化为：

　　 ∂C/∂ω_jk^L = (∂C/∂a_j^L)(∂a_j^L/∂z_j^L)*(∂z_j^L/∂ω_jk^L)

= δ_j^La_k^L-1

计算输入层上一层(L-1):

∂C/∂ω_jk^L-1= (∑_m(∂C/∂a_m^L)(∂a_m^L/∂z_m^L)(∂z_m^L/∂a_j^L-1))(/∂a_j^L-1/∂z_j^L-1)(∂z_j^L-1/∂ω_jk^L-1)

= (∑_mδ_m^Lω_mj^L)σ'(z_j^L-1)a_k^L-2

= δ_j^L-1a_k^L-2

对于处输入层的任何一层(l)：

∂C/∂ω_jk^l= (∂C/∂z_j^l )(∂z_j^l/∂ω_jk^l) = δ_j^la_k^l-1

4.证明BP4。计算输出层∂C/∂b_j^L：

∂C/∂b_j^L = ∑_m (∂C/∂a_m^L)(∂a_m^L/∂b_j^L )

这里求和是在输出层的所有神经元k上运行的，当然，第k^th个神经元的输出激活值a_m^L只依赖于当m=j时第j^th个神经元的输入权重b_j^L。所以当k≠j

　时，∂a_m^L/∂b_j^L=0。结果简化为：

　　 ∂C/∂b_j^L = (∂C/∂a_j^L)(∂a_j^L/∂z_j^L)*(∂z_j^L/∂b_j^L)

= δ_j^L

计算输入层上一层(L-1):

∂C/∂b_j^L-1= (∑_m(∂C/∂a_m^L)(∂a_m^L/∂z_m^L)(∂z_m^L/∂a_j^L-1))(/∂a_j^L-1/∂z_j^L-1)(∂z_j^L-1/∂b_j^L-1)

= (∑_mδ_m^Lω_mj^L)σ'(z_j^L-1)

= δ_j^L-1

对于处输入层的任何一层(l)：

∂C/∂b_j^l= (∂C/∂z_j^l )(∂z_j^l/∂b_j^l) = δ_j^l

参考文献

[1]]神经网络基础

[2]Neural Networks and Deep Learning. Michael A. Nielsen

[3]一文弄懂神经网络中的反向传播法

[4]深度神经网络（DNN）反向传播算法(BP)

第一节，windows和ubuntu下深度学习theano环境搭建的更多相关文章

ubuntu 深度学习cuda环境搭建，docker-nvidia 2019-02
ubuntu 深度学习cuda环境搭建 ubuntu系统版本 18.04 查看GPU型号(NVS 315 性能很差,比没有强) 首先最好有ssh服务,以下操作都是远程ssh执行 lspci | gre ...
人工智能之深度学习-初始环境搭建（安装Anaconda3和TensorFlow2步骤详解）
前言: 本篇文章主要讲解的是在学习人工智能之深度学习时所学到的知识和需要的环境配置(安装Anaconda3和TensorFlow2步骤详解),以及个人的心得体会,汇集成本篇文章,作为自己深度学习的总结 ...
ubuntu下的c/c++环境搭建
原文地址:http://www.cnblogs.com/hitwtx/archive/2011/12/03/2274556.html ubuntu下的c/c++环境搭建是比较简单,因为有apt和新立得 ...
Ubuntu16.04深度学习基本环境搭建，tensorflow , keras , pytorch , cuda
Ubuntu16.04深度学习基本环境搭建,tensorflow , keras , pytorch , cuda Ubuntu16.04安装参考https://blog.csdn.net/flyy ...
深度学习开发环境搭建教程（Mac篇）
本文将指导你如何在自己的Mac上部署Theano + Keras的深度学习开发环境. 如果你的Mac不自带NVIDIA的独立显卡(例如15寸以下或者17年新款的Macbook.具体可以在"关 ...
Ubuntu下kafka集群环境搭建及测试
kafka介绍: Kafka[1是一种高吞吐量[2] 的分布式发布订阅消息系统,有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能 ...
Ubuntu下php网站运行环境搭建
第一步:查看是否安装lamp相关软件: dpkg -s 软件名称,比如php.mysql.apache. dpkg-query -l 软件名称要列出你系统中安装的所有包,输入下面的命令:dpkg - ...
ubuntu下android开发工作环境搭建
www.bubuko.com/infodetail-655571.html 解压软件安装: sudo apt-get install unrar rar zip gzip 串口工具安装: sudo ...
linux下安卓编译apk环境搭建
ubuntu下linux安卓编译环境搭建. 配置好编译环境 (前提是已经安装了jdk,可以用java -verison 命令查看) 一.设置环境变量用vi ~/.bashrc 打开编译环境 JA ...

随机推荐

shiro框架的UsernamePasswordToken与对应Realm中的AuthenticationToken的一点比较
这里以简单的登陆为例子控制器对应的登陆方法: @RequestMapping(value = "/login", method = RequestMethod.GET) publ ...
解决mybatis generator警告Cannot obtain primary key information from the database, generated objects may be incomplete
使用 mybatis generator 生成pojo.dao.mapper时经常出现 Cannot obtain primary key information from the database ...
pip 升级
pip install --upgrade qrcode pip install --upgrade qrcode==5.3
Delphi 工具条按钮上的下拉菜单
制作步骤: 1.添加一个 TImageList: ImageList1, 然后载入些图标; 2.添加两个 TPopupMenu: PopupMenu1.PopupMenu2, 并分别添加些菜单项; 3 ...
$mount（“#app”）手动挂载
没有el属性时,证明vue还没绑定到特定的dom上,需要延迟加载,则使用.$mount("")进行手动挂载 https://blog.csdn.net/longzhoufeng/a ...
How to vi
h:left,j:down,k:up,l:right.wq #write and quitx #cut one letterdd#cut one line/ #searchs/a/b/ #replac ...
转载：关于JESD204B转换器与FPGA匹配的设计关键点
http://www.dzsc.com/data/2014-11-27/107442.html 随着更多的模数转换器(ADC)和数模转换器(DAC)支持最新的JESD204B串行接口标准,出现了FPG ...
Web API 2 Entity Framework 使用 Procedure
Recently I worked on a project, which I started as code first and then I forced to switch to Databas ...
LTI系统对WSS Processes的作用
本文主要专注讨论LTI系统对WSS Process的影响.WSS Process的主要特性有mean以及correlation,其中correlation特性在滤波器设计,信号检测,信号预测以及系统识 ...
微信web开发者工具移动调试
1 下载微信web开发者工具:https://mp.weixin.qq.com/wiki?t=resource/res_main&id=mp1455784140 下载一个自己能用的版本: 2 ...

第一节，windows和ubuntu下深度学习theano环境搭建

第一节，windows和ubuntu下深度学习theano环境搭建的更多相关文章

随机推荐

热门专题