【笔记】机器学习 - 李宏毅 - 8

反向传播

反向传播主要用到是链式法则。

概念：
损失函数Loss Function是定义在单个训练样本上的，也就是一个样本的误差。
代价函数Cost Function是定义在整个训练集上的，也就是所有样本误差的总和的平均。有没有这个平均不会影响最后的参数求解结果。
总体损失函数Total Loss Function是定义在整个训练集上的，所有误差的总和，反向传播需要最小化的值。

取一个神经元分析：

计算梯度分为两部分：
forward pass、backward pass

Forward Pass
求出的偏微分的值就是输入x的值，很好计算。

Backward Pass

激活函数是\(sigmoid\)的话，导数如图

用链式法则计算
其中\({\sigma}'(z)\)是常数，因为\(z\)在向前传播的时候就已经确定了

一直迭代计算到最后的输出层结束，然后结果逐层返回。

前向和后向：

【笔记】机器学习 - 李宏毅 - 8 - Backpropagation的更多相关文章

深度学习课程笔记（三）Backpropagation 反向传播算法
深度学习课程笔记(三)Backpropagation 反向传播算法 2017.10.06 材料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS1 ...
机器学习笔记P1(李宏毅2019)
该博客将介绍机器学习课程by李宏毅的前两个章节:概述和回归. 视屏链接1-Introduction 视屏链接2-Regression 该课程将要介绍的内容如下所示: 从最左上角开始看: Regress ...
【笔记】机器学习 - 李宏毅 - 10 - Tips for Training DNN
神经网络的表现在Training Set上表现不好 ----> 可能陷入局部最优在Testing Set上表现不好 -----> Overfitting 过拟合虽然在机器学习中,很容 ...
【笔记】机器学习 - 李宏毅 - 5 - Classification
Classification: Probabilistic Generative Model 分类:概率生成模型如果说对于分类问题用回归的方法硬解,也就是说,将其连续化.比如 \(Class 1\) ...
【笔记】机器学习 - 李宏毅 - 1 - Introduction & next step
Machine Learning == Looking for a Function AI过程的解释:用户输入信息,计算机经过处理,输出反馈信息(输入输出信息的形式可以是文字.语音.图像等). 因为从 ...
【笔记】机器学习 - 李宏毅 - 13 - Why Deep
当参数一样多的时候,神经网络变得更高比变宽更有效果.为什么会这样呢? 其实和软件行业的模块化思想是一致的. 比如,如果直接对这四种分类进行训练,长发的男孩数据较少,那么这一类训练得到的classifi ...
【笔记】机器学习 - 李宏毅 - 12 - CNN
Convolutional Neural Network CNN 卷积神经网络 1. 为什么要用CNN? CNN一般都是用来做图像识别的,当然其他的神经网络也可以做,也就是输入一张图的像素数组(pix ...
【笔记】机器学习 - 李宏毅 - 11 - Keras Demo2 & Fizz Buzz
1. Keras Demo2 前节的Keras Demo代码: import numpy as np from keras.models import Sequential from keras.la ...
【笔记】机器学习 - 李宏毅 - 9 - Keras Demo
3.1 configuration 3.2 寻找最优网络参数代码示例: # 1.Step 1 model = Sequential() model.add(Dense(input_dim=28*28 ...

随机推荐

【5min+】这些C#的运算符您都认识吗？
系列介绍 [五分钟的dotnet]是一个利用您的碎片化时间来学习和丰富.net知识的博文系列.它所包含了.net体系中可能会涉及到的方方面面,比如C#的小细节,AspnetCore,微服务中的.net ...
「C++ 篇」答应我，别再if/else走天下了可以吗
每日一句英语学习,每天进步一点点: "Without purpose, the days would have ended, as such days always end, in disi ...
Dubbo（四）：深入理解Dubbo核心模型Invoker
一.Dubbo中Invoker介绍为什么说Invoker是Dubbo核心模型呢? Invoker是Dubbo中的实体域,也就是真实存在的.其他模型都向它靠拢或转换成它,它也就代表一个可执行体,可向它 ...
Codeforces_714_B
http://codeforces.com/problemset/problem/714/B 当不同大小整数有1.2个时,肯定成立,3个时,需要判断,大于等于4个,则肯定不成立. #include & ...
webpack chunkFilename 非入口文件的命名规则 [转]
官网的文档只理解了filename是主入口的文件名,chunkFilename是非主入口的文件名 filename应该比较好理解,就是对应于entry里面生成出来的文件名.比如: { entry: { ...
MongoDB 复本集搭建
复制集的特点数据一致性主是唯一的,但不是固定的没有MySQL那样的双主结构大多数原则,集群存活节点小于等于二分之一时集群不可写,只可读. 是否能选举出新的主节点,是由当前复制集成员存活量 ...
Rust学习--变量
0x0 每种编程语言都有变量的概念,我们可以把变量理解为最简单的存储方式,它是编码过程中是必不可少的. Rust的变量很有特色.变量不可变的特性让人想起了Erlang.以及后面的模式匹配,我觉得作者应 ...
solr常用操作及集成分词器或cdh集群部署说明
首先,如果是从http://lucene.apache.org/solr/下载的solr,基本都是自带集成的jetty服务,不需要单独搭建tomcat环境,但是要注意jdk版本,直接解压通过cmd命令 ...
实验一 GIT 代码版本管理
实验一 GIT 代码版本管理实验目的: 1)了解分布式分布式版本控制系统的核心机理: 2)熟练掌握git的基本指令和分支管理指令: 实验内容: 1)安装git 2)初始配置git ,git ini ...
js—数组那些事儿
数组维度升级创建一维数组 //创建一维数组 var a=[]; var b=new Array(); var c=[1,2,'w']; var d=[1,2,[1,2]]; 创建二维数组 var c ...

【笔记】机器学习 - 李宏毅 - 8 - Backpropagation

【笔记】机器学习 - 李宏毅 - 8 - Backpropagation的更多相关文章

随机推荐

热门专题