吴恩达机器学习笔记（四） —

主要内容：

一.模型简介

二.一些变量所代表的含义

三.代价函数

四.Forward Propagation

五.Back Propagation

六.算法流程

待解决问题：

视频中通过指出：当特征变多时（或者非线性），利用logistic回归模型解决问题将导致计算量很大，即算法复杂度很高。然后就此引出神经网路，所以说神经网路在解决多特征（或者非线性）问题上是比logistic回归更优的。但为什么呢？有什么合理的解释？

一.模型简介

1.最简单的神经网络就是只有输入层和输出层：

2.稍微复杂一点（中间的被称为隐藏层）：

3.其中，当前层的输出作为下一层每一个结点的输入（的一部分），即n*m的全相连，且每一条边都带有权重，就是说我们要训练的参数。

4.在每一层当中，除了我们预先设定的结点之外，还在最上面添加一个结点(bias unit)作为偏移值，其值为1。

5.hθ(x)为Logistic回归函数。

二.一些变量所代表的含义

为了方便描述神经网络，对一些变量进行描述（注意：此处的上标表示第几层，从1开始）：

x：最原始的输入

a：当前层的输出，其中a1(上标) = x

z：z = θx

有如下关系：

三.代价函数

1.代价函数：

2.向量化后：

四.Forward Propagation

foward propagation就是将输入x，经过一层层的神经网络，最后到达输出层，并输出结果hθ(x)。

一张图可以很好地解释其过程：

五.Back Propagation（求梯度）

我们可以通过foward propagation求出输出结果hθ(x)，接下来就是要减少误差的而进行参数调整了，一贯的做法是梯度下降。

可知Logistic回归的梯度下降的表达式为：

由于神经网络也是利用Logistic回归的sigmoid函数，那么其梯度下降的表达式也应该类似。

可知最后一层，也就是输出层的输出结果为hθ(x)，也就是预测值。那么误差就是hθ(x)-Y，对应了上式中的“(hθ(x)-Y)”，记δ=hθ(x)-Y。

但是，我们只知道最后一层的δ，即hθ(x)-Y，而隐藏层的δ却不能够直接看出来，那应该如何呢？

可知输出层的hθ(x)，是倒数第二层通过一定的规则计算出来的；反过来，倒数第二层计算所出现的误差，也可以通过输出层hθ(x)与真实值的误差反过来求。其中最重要的就是参数θ，因为它规定着输入(或输出)在当前结点所占的比例。

知道了Back Propagation的思想后，就需要着手具体如何求出δ了，其方法就是微积分中的“链式求导”。可知当前层的输出a(l)（可以看做一个变量），通过相关的映射（或者说函数）得出下一层的输出a(l+1)。此时把a(l+1) 看成y，a(l)看成x，而y = f(x)。我么已知y所造成的误差为δ，而y又是x的函数，所以x所造成的误差就等于：δ*f'(x)。与Logistic回归不同的是：神经网络在两层之间存在着n*m的全相连，每一条边都代表着a-->b的权重，即参数θ。在求误差δ的时候，应该乘上参数θ，如下：

因此，一直往前递推，就可以求出各层（输入层不需要求，因为总为0）的误差δ，即“(hθ(x)-Y)”。梯度就可以求出来了，之后就轮到梯度下降大显身手了。

求梯度的过程总结：

六.算法流程：

吴恩达机器学习笔记（四） —— BP神经网络的更多相关文章

吴恩达机器学习笔记（六） —— 支持向量机SVM
主要内容: 一.损失函数二.决策边界三.Kernel 四.使用SVM (有关SVM数学解释:机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机) 一.损失函数二.决策边界对于: 当C非常 ...
Coursera-AndrewNg(吴恩达)机器学习笔记——第四周编程作业（多分类与神经网络）
多分类问题——识别手写体数字0-9 一.逻辑回归解决多分类问题 1.图片像素为20*20,X的属性数目为400,输出层神经元个数为10,分别代表1-10(把0映射为10). 通过以下代码先形式化展示数 ...
[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.5 SVM参数细节标记点选取标记点(landma ...
[吴恩达机器学习笔记]11机器学习系统设计3-4/查全率/查准率/F1分数
11. 机器学习系统的设计觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 11.3 偏斜类的误差度量 Error Metr ...
吴恩达机器学习笔记61-应用实例：图片文字识别(Application Example: Photo OCR)【完结】
最后一章内容,主要是OCR的实例,很多都是和经验或者实际应用有关:看完了,总之,善始善终,继续加油!! 一.图像识别(店名识别)的步骤: 图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从 ...
吴恩达机器学习笔记39-误差分析与类偏斜的误差度量（Error Analysis and Error Metrics for Skewed Classes）
如果你准备研究机器学习的东西,或者构造机器学习应用程序,最好的实践方法不是建立一个非常复杂的系统,拥有多么复杂的变量:而是构建一个简单的算法,这样你可以很快地实现它. 构建一个学习算法的推荐方法为:1 ...
Machine Learning——吴恩达机器学习笔记（酷
[1] ML Introduction a. supervised learning & unsupervised learning 监督学习:从给定的训练数据集中学习出一个函数(模型参数), ...
[吴恩达机器学习笔记]14降维5-7重建压缩表示/主成分数量选取/PCA应用误区
14.降维觉得有用的话,欢迎一起讨论相互学习~Follow Me 14.5重建压缩表示 Reconstruction from Compressed Representation 使用PCA,可以把 ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...

随机推荐

ganlia安装配置文档
gangliaz在ubuntu中安装和配置很简单 1. 服务器端安装 sudo apt-get install ganglia-monitor ganglia-webfrontend rrdtool ...
Java后台代码调用Spring的@Service Bean的方式
比如:在我的project中有一个类CompassIndexOperation,以: @Service("CompassIndexOperation") @Transactiona ...
基于 Token 的身份验证
最近了解下基于 Token 的身份验证,跟大伙分享下.很多大型网站也都在用,比如 Facebook,Twitter,Google+,Github 等等,比起传统的身份验证方法,Token 扩展性更强, ...
基于JT/T 1078协议设计和开发部标视频服务器
交通部与2016年10月份推出了JT/T 1078-2016标准,全称是<道路运输车辆卫星定位系统视频通信协议>.该标准将改变以往两客一危车辆的视频监控设备通信协议都是设备厂商私有协议的局 ...
View Controller容器
在 iOS 5 之前,view controller 容器是 Apple 的特权.实际上,在 view controller 编程指南中还有一段申明,指出你不应该使用它们.Apple 对 view c ...
org.hibernate.type.SerializationException: could not deserialize 反序列化失败
1.查看实体类有没有实现Serializable接口例:public class Student implements Serializable { ***** } 2.看表中的字段有没有在实体中进 ...
多媒体开发之--- rtsp 中的H264 编码+打包+解码相关知识es、pes、ts...
1)ES流(Elementary Stream): 也叫基本码流,包含视频.音频或数据的连续码流. 2)PES流(Packet Elementary Stream): 也叫打包的基本码流, 是将基本的 ...
Linux5_环境变量
1.总结背景在linux系统下,下载并安装了应用程序,很有可能在键入它的名称时出现“command not found”的提示内容. 每次都到安装目标文件夹内,找到可执行文件来进行操作就太繁琐了.这 ...
Lumen开发：简单实现auth用户认证
打开bootstrap/app.php,取消下面两段代码的注释, $app->middleware([ App\Http\Middleware\ExampleMiddleware::class ...
Linux nginx部署laravel
Composer Composer 是 php 的一个依赖管理工具.它允许你申明项目所依赖的代码库,它会在你的项目中为你安装他们.运行 Composer 需要 PHP 5.3.2+ 以上版本.一些敏感 ...

吴恩达机器学习笔记（四） —— BP神经网络

吴恩达机器学习笔记（四） —— BP神经网络的更多相关文章

随机推荐

热门专题