《Machine Learning》系列学习笔记之第四周
第四周
Model Representation I
让我们来看看如何使用神经网络来表示假设函数。在非常简单的水平上,神经元基本上是将输入(树突)作为输入到输出(轴突)的电输入(称为“尖峰”)的计算单元。在我们的模型中,我们的树突像输入特征x1 ... xn,输出是我们的假设函数的结果。在这个模型中,我们的x0输入节点有时被称为“偏置单元”。它总是等于1.在神经网络中,我们使用与分类11 + e-θTx相同的逻辑函数,但我们有时称之为S形(逻辑)激活函数。在这种情况下,我们的“theta”参数有时称为“权重”。
在视觉上,一个简单的表示形式如下:
|
⎡⎣x0x1x2⎤⎦→[ ]→hθ(x) |
我们的输入节点(层1),也称为“输入层”,进入另一个节点(层2),其最终输出称为“输出层”的假设函数。
我们可以在输入和输出层之间有称为“隐藏层”的中间节点层。
在这个例子中,我们标记这些中间或“隐藏”层节点a 20 ... a 21n并将其称为“激活单元”。
a(j)i =层j中单元i的“激活”=控制从层j到层j + 1的函数映射的权重矩阵
|
a(j)i="activation" of unit i in layer j Θ(j)=matrix of weights controlling function mapping from layer j to layer j+1 |
如果我们有一个隐藏层,它看起来像:
|
⎡⎣⎢⎢x0 x1 x2 x3⎤⎦⎥⎥→⎡⎣⎢⎢⎢a(2)1 a(2)2 a(2)3⎤⎦⎥⎥⎥→hθ(x) |
每个“激活”节点的值如下获得:
|
a(2)1=g(Θ(1)10x0+Θ(1)11x1+Θ(1)12x2+Θ(1)13x3) a(2)2=g(Θ(1)20x0+Θ(1)21x1+Θ(1)22x2+Θ(1)23x3) a(2)3=g(Θ(1)30x0+Θ(1)31x1+Θ(1)32x2+Θ(1)33x3) hΘ(x)=a(3)1=g(Θ(2)10a(2)0+Θ(2)11a(2)1+Θ(2)12a(2)2+Θ(2)13a(2)3) |
这就是说,我们通过使用3×4的参数矩阵来计算我们的激活节点。我们将每行参数应用到我们的输入,以获得一个激活节点的值。我们的假设输出是应用于我们的激活节点的值的和的逻辑函数,其已经被包含用于我们的第二层节点的权重的又一参数矩阵Θ(2)相乘。
每个层获得其自己的权重矩阵Θ(j)。
这些权重矩阵的尺寸确定如下:
如果网络在层j中具有sj
个单元并且在层j
+ 1中具有sj+1
个单元,则Θ(j)将具有尺寸sj+1×(sj+1)。
+1来自“偏置节点”的Θ(j)中的加法,x0和Θ(j)0。换句话说,输出节点将不包括偏置节点,而输入将会。下面的图像总结了我们的模型表示:
示例:第1层有2个输入节点,第2层有4个激活节点。Θ(1)的尺寸将为4×3,其中sj=2
和sj+1=4,因此sj+1×(sj+1)=4×3。
Model
Representation II
为了重复,以下是神经网络的示例:
a(2)1=g(Θ(1)10x0+Θ(1)11x1+Θ(1)12x2+Θ(1)13x3)
a(2)2=g(Θ(1)20x0+Θ(1)21x1+Θ(1)22x2+Θ(1)23x3)
a(2)3=g(Θ(1)30x0+Θ(1)31x1+Θ(1)32x2+Θ(1)33x3)
hΘ(x)=a(3)1=g(Θ(2)10a(2)0+Θ(2)11a(2)1+Θ(2)12a(2)2+Θ(2)13a(2)3)
在本节中,我们将对上述函数进行向量化实现。
我们要定义一个新的变量z(j)k,它包含了g函数中的参数。
在我们前面的例子中,如果我们用变量z替换所有的参数,我们会得到:
|
a(2)1=g(z(2)1) a(2)2=g(z(2)2) a(2)3=g(z(2)3) |
换句话说,对于层j
= 2和节点k,变量z将是:
|
z(2)k=Θ(1)k,0x0+Θ(1)k,1x1+⋯+Θ(1)k,nxn |
The
vector representation of x and zj is:
|
x=⎡⎣⎢⎢x0x1⋯xn⎤⎦⎥⎥z(j)=⎡⎣⎢⎢⎢⎢z(j)1z(j)2⋯z(j)n⎤⎦⎥⎥⎥⎥ |
Setting
x=a(1),
we can rewrite the equation as:
|
z(j)=Θ(j−1)a(j−1) |
我们通过具有高度(n
+ 1)的矢量a(j−1)将我们的矩阵Θ(j−1)乘以尺寸sj×(n+1)sj×(n+1)(其中sj
是我们的激活节点的数目)。这给出了我们具有高度sj的向量z(j)。现在我们可以得到我们的层j的激活节点的向量如下:
a(j)=g(z(j))
其中我们的函数g可以元素地应用于我们的向量z(j)。
然后,我们可以在计算a(j)之后向层j添加偏置单元(等于1)。这将是元素a(j)0
并且将等于1.为了计算我们的最终假设,让我们先计算另一个z向量:
z(j+1)=Θ(j)a(j)
我们通过将Θ(j-1)之后的下一个θ矩阵与我们刚刚得到的所有激活节点的值相乘来获得这个最终z向量。该最后θ矩阵Θ(j)将仅具有乘以一列a(j)的一行,使得我们的结果是单个数。然后我们得到我们的最终结果:
hΘ(x)=a(j+1)=g(z(j+1))
注意,在这最后一步,在层j和层j
+
1之间,我们做的事情与在logistic回归中做的完全相同。将所有这些中间层添加到神经网络中允许我们更优雅地产生有趣的和更复杂的非线性假设。
《Machine Learning》系列学习笔记之第四周的更多相关文章
- [Machine Learning]学习笔记-Logistic Regression
[Machine Learning]学习笔记-Logistic Regression 模型-二分类任务 Logistic regression,亦称logtic regression,翻译为" ...
- Machine Learning 学习笔记
点击标题可转到相关博客. 博客专栏:机器学习 PDF 文档下载地址:Machine Learning 学习笔记 机器学习 scikit-learn 图谱 人脸表情识别常用的几个数据库 机器学习 F1- ...
- [Python & Machine Learning] 学习笔记之scikit-learn机器学习库
1. scikit-learn介绍 scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上.值得一提的是,scikit-learn最 ...
- Machine Learning 学习笔记1 - 基本概念以及各分类
What is machine learning? 并没有广泛认可的定义来准确定义机器学习.以下定义均为译文,若以后有时间,将补充原英文...... 定义1.来自Arthur Samuel(上世纪50 ...
- Coursera 机器学习 第6章(上) Advice for Applying Machine Learning 学习笔记
这章的内容对于设计分析假设性能有很大的帮助,如果运用的好,将会节省实验者大量时间. Machine Learning System Design6.1 Evaluating a Learning Al ...
- Structuring Machine Learning Projects 笔记
1 Machine Learning strategy 1.1 为什么有机器学习调节策略 当你的机器学习系统的性能不佳时,你会想到许多改进的方法.但是选择错误的方向进行改进,会使你花费大量的时间,但是 ...
- machine learning学习笔记
看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/clas ...
- [Machine Learning]学习笔记-线性回归
模型 假定有i组输入输出数据.输入变量可以用\(x^i\)表示,输出变量可以用\(y^i\)表示,一对\(\{x^i,y^i\}\)名为训练样本(training example),它们的集合则名为训 ...
- 吴恩达Machine Learning学习笔记(一)
机器学习的定义 A computer program is said to learn from experience E with respect to some class of tasks T ...
随机推荐
- JS加载相对路径脚本的方法 - 汇总
js加载脚本的方式有很多,但是各有各的用途. 最近公司https项目改造,对于资源文件这一块,也是遇到一些问题,现在就来总结一下,怎样改造https的脚本吧~! 方法1.借助服务端语言如PHP,输入当 ...
- Java程序性能优化读书笔记(一):Java性能调优概述
程序性能的主要表现点: 执行速度:程序的反映是否迅速,响应时间是否足够短 内存分配:内存分配是否合理,是否过多地消耗内存或者存在内存泄漏 启动时间:程序从运行到可以正常处理业务需要花费多少时间 负载承 ...
- 正则匹配所有的a标签
<a\b[^>]+\bhref="([^"]*)"[^>]*>([\s\S]*?)</a>分组1和分组2即为href和value解释: ...
- redis的删除库应用(linux)
1.首先从linux进入redis的安装目录下 2.用redis-cli在Shell命令行下启动Redis客户端工具. 3.select 库名 进入到库下 4.flushdb 刷新当前库 redis的 ...
- Swift 网络请求数据与解析
一: Swift 网络数据请求与处理最常用第三方 又有时间出来装天才了,还是在学swift,从中又发现一些问题,这两天上网找博客看问题弄的真的心都累.博客一篇写出来,好多就直接照抄,就没有实质性的把问 ...
- Monit:开源服务器监控工具
Monit是一个跨平台的用来监控Unix/linux系统(比如Linux.BSD.OSX.Solaris)的工具.Monit特别易于安装,而且非常轻量级(只有500KB大小),并且不依赖任何第三方程序 ...
- Spark源码分析之Spark Shell(上)
终于开始看Spark源码了,先从最常用的spark-shell脚本开始吧.不要觉得一个启动脚本有什么东东,其实里面还是有很多知识点的.另外,从启动脚本入手,是寻找代码入口最简单的方法,很多开源框架,其 ...
- 子进程 已安装 post-installation 脚本 返回错误状态 1,dpkg: 处理软件包 python-crypto (--configure)时出错: 该软件包正处于非常不稳定的状态;
这几天在学习redis的时候,装软件总是报错,两个问题都和dpkg有关,上网查阅了些解决办法,发现整体来说执行以下方法均可解决. 虽然每个人需要安装的包不同,但是出现此类问题的不同也只有安装包的名字, ...
- JavaScript 基本类型值-Undefined、Null、Boolean
▓▓▓▓▓▓ 大致介绍 ECMAScript中有5中简单的数据类型(也称为基本数据类型):Undefined.Null.Boolean.Number.String. ▓▓▓▓▓▓ Undefined ...
- 2017-2-20 C#基础 运算符
C#的运算符主要分五种:算数运算符,关系运算符,逻辑运算符,条件运算符,赋值运算符.算术运算符有 + - * / % ++ --;关系运算符有 == != > ...