100天搞定机器学习|day37 无公式理解反向传播算法之精髓

本篇为100天搞定机器学习之第37天，亦为3Blue1Brown《深度学习之反向传播算法》学习笔记。

上集提到我们要找到特定权重和偏置，从而使代价函数最小化，我们需要求得代价函数的负梯度，它告诉我们如何改变连线上的权重偏置，才能让代价下降的最快。反向传播算法是用来求这个复杂到爆的梯度的。

上一集中提到一点，13000维的梯度向量是难以想象的。换个思路，梯度向量每一项的大小，是在说代价函数对每个参数有多敏感。如下图，我们可以这样里理解，第一个权重对代价函数的影响是是第二个的32倍。

我们先不要管反向传播算法这一堆公式，当我们真正理解了这算法，这里的每一步就会无比清晰了。

我们来考虑一个还没有被训练好的网络。我们并不能直接改动这些激活值，只能改变权重和偏置值。但记住，我们想要输出层出现怎样的变动，还是有用的。我们希望图像的最后分类结果是2，我们期望第3个输出值变大，其余输出值变小，并且变动的大小应该与现在值和目标值之间的差成正比。举个例子，增大数字2神经元的激活值，就应该比减少数字8神经元的激活值来得重要，因为后者已经很接近它的目标了。

进一步，就来关注数字2这个神经元，想让它的激活值变大，而这个激活值是把前一层所有激活值的加权和加上偏置值。要增加激活值，我们有3条路可以走，一增加偏置，二增加权重，或者三改变上一层的激活值。先来看如何调整权重，各个权重它们的影响力各不相同，连接前一层最亮的神经元的权重，影响力也最大，因为这些权重与大的激活值相乘。增大这几个权重，对最终代价函数造成的影响，就比增大连接黯淡神经元的权重所造成的影响，要大上好多倍。

请记住，说到梯度下降的时候，我们并不只看每个参数是增大还是变小，我们还看改变哪个参数的性价比最大。

第三个可以增加神经元激活值的方法是改变前一层的激活值，如果所有正权重链接的神经元更亮，所有负权重链接的神经元更暗的话，那么数字2的神经元就会更强烈的激发。我们也要依据对应权重的大小，对激活值做成比例的改变，我们并不能直接改变激活值，仅对最后一层来说，记住我们期待的变化也是有帮助的。

不过别忘了，从全局上看，只只不过是数字2的神经元所期待的变化，我们还需要最后一层其余的每个输出神经元，对于如何改变倒数第二层都有各自的想法。

我们会把数字2神经元的期待，和别的输出神经元的期待全部加起来，作为如何改变倒数第二层的指示。这些期待变化不仅是对应的权重的倍数，也是每个神经元激活值改变量的倍数。

这其实就是在实现反向传播的理念了，我们把所有期待的改变加起来，得到一串对倒数第二层改动的变化量，然后重复这个过程，改变倒数第二层神经元激活值的相关参数，一直循环到第一层。我们对其他的训练样本，同样的过一遍反向传播，记录下每个样本想怎样修改权重和偏置，最后再去一个平均值。

这里一系列的权重偏置的平均微调大小，不严格地说，就是代价函数的负梯度，至少是其标量的倍数。神奇吧？

如果梯度下降的每一步都用上每一个训练样本计算的话，那么花费的时间就太长了。实际操作中，我们一般这样做：首先把训练样本打乱，然后分成很多组minibatch，每个minibatch就当包含了100个训练样本好了。然后你算出这个minibatch下降的一步，这不是代价函数真正的梯度，然而每个minibatch会给一个不错的近似，计算量会减轻不少。

可以这样比喻：沿代价函数表面下山，minibatch方法就像醉汉漫无目的的溜下山，但是速度很快。而之前的方法就像细致入微的人，事先准确的算好了下山的方向，然后谨小慎微的慢慢走。

这就是随机梯度下降

总结一下：反向传播算法算的是单个训练样本怎样改变权重和偏置，不仅说每个参数应该变大还是变小，还包括这些变化的比例是多大才能最快地降低cost。真正的梯度下降，对好几万个训练范例都这样操作，然后对这些变化取平均值，这样计算太慢了，我们要把所有样本分到各个minibatch中，计算每个minibatch梯度，调整参数，不断循环，最终收敛到cost function的局部最小值上。理解是一回事，如何表示出来又是另一回事，下一期，我们一起将反向传播算法用微积分的形式推导出来，敬请期待！

100天搞定机器学习|day37 无公式理解反向传播算法之精髓的更多相关文章

100天搞定机器学习|day38 反向传播算法推导
往期回顾 100天搞定机器学习|(Day1-36) 100天搞定机器学习|Day37无公式理解反向传播算法之精髓上集我们学习了反向传播算法的原理,今天我们深入讲解其中的微积分理论,展示在机器学习中, ...
100天搞定机器学习|Day16 通过内核技巧实现SVM
前情回顾机器学习100天|Day1数据预处理100天搞定机器学习|Day2简单线性回归分析100天搞定机器学习|Day3多元线性回归100天搞定机器学习|Day4-6 逻辑回归100天搞定机器学习| ...
100天搞定机器学习|Day17-18 神奇的逻辑回归
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...
100天搞定机器学习|Day3多元线性回归
前情回顾 [第二天100天搞定机器学习|Day2简单线性回归分析][1],我们学习了简单线性回归分析,这个模型非常简单,很容易理解.实现方式是sklearn中的LinearRegression,我们也 ...
100天搞定机器学习|Day7 K-NN
最近事情无比之多,换了工作.组队参加了一个比赛.和朋友搞了一些小项目,公号荒废许久.坚持是多么重要,又是多么艰难,目前事情都告一段落,我们继续100天搞定机器学习系列.想要继续做这个是因为,一方面在具 ...
100天搞定机器学习|Day11 实现KNN
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day8 逻辑回归的数学原理
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day9-12 支持向量机
机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|D ...
100天搞定机器学习|Day19-20 加州理工学院公开课：机器学习与数据挖掘
前情回顾机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机 ...

随机推荐

Java用Zip进行压缩
这个总结源于Java编程思想第四版18.11节的案例: 完整代码地址: Java编程思想:压缩相关Api地址: ZipStream ZipEntry ZipFile 进行压缩时: 1.创建Check ...
openstack-neutron基本的网络类型以及分析
[概述] Neutron是OpenStack中负责提供网络服务的组件,基于软件定义网络的思想,实现了网络虚拟化下的资源管理,即:网络即服务. [功能] ·二层交换 Neutron支持多种虚拟交换机,一 ...
【CYH-01】小奔的国庆练习赛:赛后标程
前排鸣谢@找寻大佬 emm-由于头一次举办公开赛所以--准备不是很充分,所以说题解也没有备好,在这里表示歉意. 欢迎大家来发布题解,在此我们可以提供AC代码,供大家参考. T1 解析:这一题可能栈溢 ...
[leetcode] #213 House Robber II Medium (medium)
原题链接比子母题House Robber多了一个条件:偷了0以后,第n-1间房子不能偷. 转换思路为求偷盗[0,n-1)之间,以及[1,n)之间的最大值. 用两个DP,分别保存偷不偷第0间房的情况. ...
MVC设计模式与Java Web经典三层架构
MVC设计模式 MVC的概念首先我们需要知道MVC模式并不是javaweb项目中独有的,MVC是一种软件工程中的一种软件架构模式,把软件系统分为三个基本部分:模型(Model).视图(View)和控 ...
dede:channelartlist currentstyle高亮显示
我们在用DEDECMS建站时,常常会做二级栏目的功能,既要用到二级栏目,也就要通过DEDE标签再套标签的方式来实现调用,而DEDECMS多层标签调用只支持channelartlist,也就是说我们只能 ...
初探java流操作
在处理集合时,我们通常会迭代遍历它的元素,并从每个元素上执行某项操作.例如,假设我们想要对某本书中的所有长单词进行计数.首先我们要将所有单词放入一个列表中: String contents = new ...
python查漏补缺 --- 模块及异常
1.方法定义好之后,如,def test(x) : ,此时将方法名赋值给一个新的变量,那么该变量等同于方法,可以具备test方法内部的全部功能2.导包的时候,可以使用as关键字在不同的名称下导入模块或 ...
【Intellij】Hot Swap Failed & class reloaded
用 Intellij IDEA 编译程序时遇到了这个问题,如下图所示: 对结果貌似没什么影响,但暂时没找到出现这个情况的原因……
【iOS】打印方法名
为了便于追踪程序运行过程,可以在日志打印方法名,示例代码如下: NSLog(@"%@", NSStringFromSelector(_cmd)); 结果如图所示: 此外,在多个中, ...

100天搞定机器学习|day37 无公式理解反向传播算法之精髓

100天搞定机器学习|day37 无公式理解反向传播算法之精髓的更多相关文章

随机推荐

热门专题