100天搞定机器学习|day38 反向传播算法推导

往期回顾

上集我们学习了反向传播算法的原理，今天我们深入讲解其中的微积分理论，展示在机器学习中，怎么理解链式法则。

我们从一个最简单的网络讲起，每层只有一个神经元，图上这个网络就是由三个权重和三个偏置决定的，我们的目标是理解代价函数对这些变量有多敏感。这样我们就知道怎么调整这些变量，才能使代价函数下降的最快。

我们先来关注最后两个神经元，我们给最后一个神经元一个上标L，表示它处在第L层。给定一个训练样本，我们把这个最终层激活值要接近的目标叫做y，y的值为0/1。那么这个简易网络对于单个训练样本的代价就等于(a(L)−y)2。对于这个样本，我们把这个代价值标记为C0。

之前讲过，最终层的激活值公式：

换个标记方法：

整个流程就是这样的：

当然了，a(L−1)还可以再向上推一层，不过这不重要。

这些东西都是数字，我们可以想象，每个数字都对应数轴上的一个位置。我们第一个目标是来理解代价函数对权重

的微小变化有多敏感。换句话说，求C0对

的导数。的微小变化导致产生变化，然后导致，最终影响到cost。

我们把式子拆开，首先求的变化量比的变化量，即关于的导数；同力考虑变化量比的变化量，以及最终的c的变化量比上直接改动产生的变化量。

这就是链式法则

开始分别求导

这只是包含一个训练样本的代价对的导数，
总的代价函数是所有训练样本代价的总平均，它对的导数就要求出这个表达式对每一个训练样本的平均，

这只是梯度向量的一个分量，梯度由代价函数对每一个权重和偏置求导数构成。

当然了，对偏置求导数也是同样的步骤。只要把替换成

同样的，这里也有反向传播的思想

到此，我们可以方向应用链式法则，来计算代价函数对之前的权重和偏置的敏感程度

到这里，我们可以看每层不止一个神经元的情况了，其实并不复杂太多，只是多写一些下标罢了。

这些方程式和之前每层只有一个神经元的时候本质上一样的

代价函数也类似

不同的是代价函数对（L-1）层激活值的导数
因为此时，激活值可以通过不同的途径影响cost function，

只要计算出倒数第二层代价函数对激活值的敏感度，接下来重复上述过程就行了。至此，反向传播介绍完毕。

100天搞定机器学习|day38 反向传播算法推导的更多相关文章

100天搞定机器学习|day37 无公式理解反向传播算法之精髓
100天搞定机器学习(Day1-34) 100天搞定机器学习|Day35 深度学习之神经网络的结构 100天搞定机器学习|Day36 深度学习之梯度下降算法本篇为100天搞定机器学习之第37天,亦 ...
100天搞定机器学习|Day7 K-NN
最近事情无比之多,换了工作.组队参加了一个比赛.和朋友搞了一些小项目,公号荒废许久.坚持是多么重要,又是多么艰难,目前事情都告一段落,我们继续100天搞定机器学习系列.想要继续做这个是因为,一方面在具 ...
100天搞定机器学习|Day11 实现KNN
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day8 逻辑回归的数学原理
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day9-12 支持向量机
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day16 通过内核技巧实现SVM
前情回顾机器学习100天|Day1数据预处理100天搞定机器学习|Day2简单线性回归分析100天搞定机器学习|Day3多元线性回归100天搞定机器学习|Day4-6 逻辑回归100天搞定机器学习| ...
100天搞定机器学习|Day17-18 神奇的逻辑回归
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day19-20 加州理工学院公开课：机器学习与数据挖掘
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day21 Beautiful Soup
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...

随机推荐

实例解说AngularJS在自动化测试中的应用
一.什么是AngularJS ? 1.AngularJS是一组用来开发web页面的框架.模板以及数据绑定和丰富UI的组件: 2.AngularJS提供了一系列健壮的功能,以及将代码隔离成模块的方法: ...
小白教程 Java web maven项目Windows下部署阿里云服务器全过程（买服务器，打包项目，连接服务器，配置服务器，部署项目）
-------------首先:购买服务器---------------- Step1: 在https://www.aliyun.com/?utm_content=se_1043015注册登录阿里云 ...
idea万能快捷键(alt enter)，你不知道的17个实用技巧！！！
说明 IDEA里有一个万能快捷键(alt enter),功能非常强大,同一个快捷键,可以根据不同的语境提示你不同的操作, 很多人可能还不了解这些功能,在处理代码的时候还手动处理,了解这些技巧之后,你编 ...
Excel催化剂开源第8波-VSTO开发之异步调用方法
在VSTO开发过程中,因其和普通的Winform开发有点差别,具体细节笔者也说不清楚,大概是VSTO的插件是寄生在Excel中,不属于独立的进程之类的,其异步方法调用时,未能如Winform那样直接用 ...
快速掌握mongoDB(五)——通过mongofiles和C#驱动操作GridFS
1 GridFS简介当前Bson能存储的最大尺寸是16M,我们想把大于16M的文件存入mongoDB中怎么办呢?mongoDB提供的GridFS就是专门做这个的.使用GridFS存储大文件时,文件被 ...
我的博客即将同步至腾讯云+社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan?invite_code=3cp8ng15g94wc
我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=3cp8ng15g94wc
iOS程序员如何提升核心竞争力，防止自己被裁员？
前言: 核心竞争力最早由普拉哈拉德和加里·哈默尔两位教授提出,通常认为核心竞争力,即企业或个人相较于竞争对手而言所具备的竞争优势与核心能力差异,说白了就是你的优势,而且最好是独一无二的的优势,这就是核 ...
python中的元类（metaclass）
认识python中元类的准备工作. 1,首先需要明白一个概念就是python中一切皆为对象. input: class Trick(object): pass ') print type(1234) ...
【TensorFlow 1】操作变量
打印在tf中直接打印只是输出变量格式,如: #代码 data1 = tf.constant(2,dtype=tf.int32) #浮点数据 data2 = tf.Variable(10,name=' ...
0 ElasticSearch
注意事项需要jdk环境1.7以上 Elasticsearch Kibana 的下载地址统一为https://www.elastic.co/downloads/ 问题排查可以登录https://dis ...

100天搞定机器学习|day38 反向传播算法推导

100天搞定机器学习|day38 反向传播算法推导的更多相关文章

随机推荐

热门专题