MachineLearning Exercise 4 ：Neural Networks Learning

nnCostFunction

消耗公式:

a1 = [ones(m,) X];

z2 = a1*Theta1';

pre = sigmoid(a1*Theta1');

a2 = [ones(m,) pre];

z3 = a2*Theta2';

a3 = sigmoid(z3);

y_vec = zeros(m,num_labels);

for i=:m;

    y_vec(i,y(i)) = ;

end

for i=:m

    J = J + y_vec(i,:)*log(a3(i,:)')+(1-y_vec(i,:))*log(1-a3(i,:))';

end

J = (-/m)*J;

% add regularized

J = J + (lambda/(*m))*(sum(sum(Theta1(:,:end).^))+sum(sum(Theta2(:,:end).^)));

% back

Delta1 = zeros(size(Theta1));

Delta2 = zeros(size(Theta2));

for i=:m,

    delta3 = a3(i,:) - y_vec(i,:);

    temp = (delta3*Theta2);

    delta2 = temp(:,:end).*sigmoidGradient(z2(i,:));  

    Delta2 = Delta2 + delta3' * a2(i,:);  

    Delta1 = Delta1 + delta2' * a1(i,:);

end;  

Theta2_grad = Delta2/m;

Theta1_grad = Delta1/m;  

Theta2_grad(:,:end) = Theta2_grad(:,:end) + lambda * Theta2(:,:end) / m;

Theta1_grad(:,:end) = Theta1_grad(:,:end) + lambda * Theta1(:,:end) / m;

为了方便使用fminunc()，这里讲Theta1和Theta2展开组合成一个vector（nn_params=[Theta1(:);Theta2(:)]），在需要使用时使用reshape重构。
初始化是，y是一个由0到9组成的向量，由于我们使用了sigmoid函数，需要将y转化成一个编码式的矩阵。
a1，a2，a3分别为各层激活值。
对矩阵使用一次sum只是分别将行相加求和得到一个向量，因此在求消耗值时应该使用两次sum。
没必要求delta1，因为第一层是我们的原始输入数据，不存在误差一说。

反向传播算法公式推导

反向传播算法的本质是利用链式求导法则，虽然神经网络求grad的公式一眼看不明白，但实质都是根据对 J 求导推导出来的，下面将给出一个大致的分析过程：

这是我们熟悉的cost函数，这里故意没有写求和符号，把各种角标丢掉，使公式清晰一些，而且也不影响推导过程。

我们假设有神经网络L层，那么对thetaL-1求导公式为：

上一层公式为：

从上边两个公式就可以看出，他们是有公共部分的，而这个公共部分就是我们的delta：

以此类推，之后的各层delta就有了：

把delta带入我们的求导公式中：

有了上面的解释，整个过程基本就比较明了了，让我们再仔细验证一番，首先从输出层开始，也就是练习的三层神经网络最后一层;

其中

然后我们将开头的cost函数变换为，对a(L)求导得：

由于a(L)=g(z)，而g(z)就是我们的s函数，所以a(L)对z求导得：

这样就可以得到delta了：

终于，看到一丝曙光了，对于练习中的三层神经网络来说，delta3的值显而易见了：

z的值是theta*a，因此：

把上边的总结下，对于输出层，我们得到：

然后是隐藏层：

对于三层网络来说：

最后带入整合：

MachineLearning Exercise 4 ：Neural Networks Learning的更多相关文章

Andrew Ng机器学习四：Neural Networks Learning
背景:跟上一讲一样,识别手写数字,给一组数据集ex4data1.mat,,每个样例都为灰度化为20*20像素,也就是每个样例的维度为400,加载这组数据后,我们会有5000*400的矩阵X(5000个 ...
斯坦福大学公开课机器学习： neural networks learning - autonomous driving example（通过神经网络实现自动驾驶实例）
使用神经网络来实现自动驾驶,也就是说使汽车通过学习来自己驾驶. 下图是通过神经网络学习实现自动驾驶的图例讲解: 左下角是汽车所看到的前方的路况图像.左上图,可以看到一条水平的菜单栏(数字4所指示方向) ...
Machine Learning - 第5周（Neural Networks: Learning）
The Neural Network is one of the most powerful learning algorithms (when a linear classifier doesn't ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 5) Neural Networks Learning
本栏目内容来自Andrew NG老师的公开课:https://class.coursera.org/ml/class/index 一般而言, 人工神经网络与经典计算方法相比并非优越, 只有当常规方法解 ...
【Deep Learning Nanodegree Foundation笔记】第 7 课：NEURAL NETWORKS Intro to Neural Networks
In this lesson, you'll dive deeper into the intuition behind Logistic Regression and Neural Networks ...
Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning
原文 http://blog.csdn.net/abcjennifer/article/details/7758797 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
Ng第九课：神经网络的学习(Neural Networks: Learning)
9.1 代价函数 9.2 反向传播算法 9.3 反向传播算法的直观理解 9.4 实现注意:展开参数 9.5 梯度检验 9.6 随机初始化 9.7 综合起来 9.8 自主驾驶 9.1 ...
论文翻译：Neural Networks With Few Multiplications
目录 Abstract 1. Introduction 2.Related Work 3.Binary And Ternary Connect 3.1 BINARY CONNECT REVISITED ...
斯坦福大学公开课机器学习：Neural Networks，representation: non-linear hypotheses（为什么需要做非线性分类器）
如上图所示,如果用逻辑回归来解决这个问题,首先需要构造一个包含很多非线性项的逻辑回归函数g(x).这里g仍是s型函数(即 ).我们能让函数包含很多像这的多项式,当多项式足够多时,那么你也许能够得到可以 ...

随机推荐

Cisco Packet Tracer中通过集线器组网
Cisco Packet Tracer中可以通过集线器将多台电脑完成通信. Cisco Packet Tracer 6.2.0 一.添加三台电脑设备 1.按照下图1.2步骤操作,2步骤执行三次,拖拽P ...
树莓派修改VNC分辨率
1.打开终端输入 sudo raspi-config 2. 选择 Advanced Options 再选择 Resolution 3.选择想要的分辨率,确定 4.重启
eclipse生成ant build.xml打war包
背景: 最近想实现jenkins+ant命令一键打war包,部署到测试环境,然后自动化接口测试,结果发现用eclipse本身导出的ant buildfiles文件,打包出来都是空文件.很多代码都没 ...
c语言数字图像处理（四）：灰度变换
灰度变换灰度变换函数 s = T(r) 其中r为输入图像在(x, y)点处的灰度值,s为输出图像在(x, y)点处的灰度值灰度变换的作用上图所示的两幅T(s)函数的图像曲线,第一幅图可以增强 ...
Hyperledger Fabric CA User’s Guide——CA用户指南（一）
Fabric CA用户指南 Hyperledger Fabric CA是一种用于Hyperledger Fabric的认证机构(CA). 它提供了如下特性: 登记身份(注册ID),或者连接到作为用户注 ...
Ubuntu系统无法识别Logitech M590蓝牙鼠标的问题
参见 - https://blog.csdn.net/yh2869/article/details/73119018 亲测可用. 系统:ubuntu 16.04 64bit 现象:鼠标配对可以成功,但 ...
【RL系列】Multi-Armed Bandit问题笔记
这是我学习Reinforcement Learning的一篇记录总结,参考了这本介绍RL比较经典的Reinforcement Learning: An Introduction (Drfit) .这本 ...
Refs 和 DOM
在常规的 React 数据流中,props 是父组件与子组件交互的唯一方式.要修改子元素,你需要用新的 props 去重新渲染子元素.然而,在少数情况下,你需要在常规数据流外强制修改子元素.被修改的子 ...
记一次线上gc调优的过程
近期公司运营同学经常表示线上我们一个后台管理系统运行特别慢,而且经常出现504超时的情况.对于这种情况我们本能的认为可能是代码有性能问题,可能有死循环或者是数据库调用次数过多导致接口运行 ...
IDEA2017.3.4破解方式及lombok图文配置详解
下载jetbrainsCrack-2.7-release-str.jar包下载地址: https://files.cnblogs.com/files/xifenglou/JetBrains.zip ...

MachineLearning Exercise 4 ：Neural Networks Learning

nnCostFunction

反向传播算法公式推导

MachineLearning Exercise 4 ：Neural Networks Learning的更多相关文章

随机推荐

热门专题