Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation

原文 http://blog.csdn.net/abcjennifer/article/details/7749309

本栏目（Machine learning）包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM（Support Vector Machines 支持向量机）、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine learning中Andrew老师的讲解。（https://class.coursera.org/ml/class/index）

第四讲——Neural Networks 神经网络的表示

===============================

（一）、为什么引入神经网络？——Nonlinear hypothesis

（二）、神经元与大脑（Neurons and Brain）

（三）、神经网络的表示形式

（四）、怎样用神经网络实现逻辑表达式？

（五）、分类问题（Classification）

本章主要围绕神经网络的建模及其线性表示（即neural networks的representation）做以初步了解，在下一章中将会有更详细的神经网络如何学习方面的知识。

===============================

（一）、为什么引入神经网络？——Nonlinear hypothesis

之前我们讨论的ML问题中，主要针对Regression做了分析，其中采用梯度下降法进行参数更新。然而其可行性基于假设参数不多，如果参数多起来了怎么办呢？比如下图中这个例子：从100*100个pixels中选出所有XiXj作为logistic regression的一个参数，那么总共就有5*10^7个feature，即x有这么多维。

所以引入了Nonlinear hypothesis，应对高维数据和非线性的hypothesis（如下图所示）：

===============================

（二）、神经元与大脑（neurons and brain）

神经元工作模式：

神经网络的逻辑单元：输入向量x（input layer），中间层a(2,i)（hidden layer）, 输出层h(x)（output layer）。

其中，中间层的a(2,i)中的2表示第二个级别（第一个级别是输入层），i表示中间层的第几个元素。或者可以说，a(j,i) is the activation of unit i in layer j.

===============================

（三）、神经网络的表示形式

从图中可知，中间层a(2，j)是输入层线性组合的sigmod值，输出又是中间层线性组合的sigmod值。

下面我们进行神经网络参数计算的向量化：

令z⁽²⁾表示中间层，x表示输入层，则有

，

z⁽²⁾=Θ⁽¹⁾x

a⁽²⁾=g(z⁽²⁾)

或者可以将x表示成a⁽¹⁾，那么对于输入层a⁽¹⁾有[x_0~x_3]4个元素，中间层a⁽²⁾有[a⁽²⁾₀~a⁽²⁾₃]4个元素（其中令a⁽²⁾₀=1），则有

h(x)= a⁽³⁾=g(z⁽³⁾)

z⁽³⁾=Θ⁽²⁾a⁽²⁾

通过以上这种神经元的传递方式（input->activation->output）来计算h(x), 叫做Forward propagation, 向前传递。

这里我们可以发现，其实神经网络就像是logistic regression，只不过我们把logistic regression中的输入向量[x₁~x₃]变成了中间层的[a⁽²⁾₁~a⁽²⁾₃], 即

h(x)=g(Θ⁽²⁾₀ a⁽²⁾₀+Θ⁽²⁾₁ a⁽²⁾₁+Θ⁽²⁾₂ a⁽²⁾₂+Θ⁽²⁾₃ a⁽²⁾₃)

而中间层又由真正的输入向量通过Θ⁽¹⁾学习而来，这里呢，就解放了输入层，换言之输入层可以是original input data的任何线性组合甚至是多项式组合如set x1*x2 as original x1...另外呢，具体怎样利用中间层进行更新下面会更详细地讲；此外，还有一些其他模型，比如：

===============================

（四）、怎样用神经网络实现逻辑表达式？

神经网路中，单层神经元（无中间层）的计算可用来表示逻辑运算，比如逻辑AND、逻辑或OR

举例说明：逻辑与AND；下图中左半部分是神经网络的设计与output层表达式，右边上部分是sigmod函数，下半部分是真值表。

给定神经网络的权值就可以根据真值表判断该函数的作用。再给出一个逻辑或的例子，如下图所示：

以上两个例子只是单层传递，下面我们再给出一个更复杂的例子，用来实现逻辑表达< x1 XNOR x2 >, 即逻辑同或关系，它由前面几个例子共同实现：

将AND、NOT AND和 OR分别放在下图中输入层和输出层的位置，即可得到x1 XNOR x2，道理显而易见：

a²₁ = x1 && x2

a²₂ = （﹁x1）&&（﹁x2）

a³₁ =a²₁||a²₁ =(x1 && x2) || （﹁x1）&&（﹁x2） = x1 XNOR x2；

应用：手写识别系统

===============================

（五）、分类问题（Classification）

记得上一章中我们讲过的one-vs-all分类问题么？one-vs-all方法是把二类分类问题到多类分类的一个推广，在这里，我们就讲述如何用神经网络进行分类。网络设计如下图所示：

输入向量x有三个维度，两个中间层，输出层4个神经元分别用来表示4类，也就是每一个数据在输出层都会出现[a b c d]^T，且a,b,c,d中仅有一个为1，表示当前类。

===============================

小结

本章引入了ML中神经网络的概念，主要讲述了如何利用神经网络的construction及如何进行逻辑表达function的构造，在下一章中我们将针对神经网络的学习过程进行更详细的讲述。

Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation的更多相关文章

（原创）Stanford Machine Learning (by Andrew NG) --- (week 4) Neural Networks Representation
Andrew NG的Machine learning课程地址为:https://www.coursera.org/course/ml 神经网络一直被认为是比较难懂的问题,NG将神经网络部分的课程分为了 ...
8、神经网络：表述(Neural Networks: Representation)
8.1 非线性假设我们之前学的,无论是线性回归还是逻辑回归都有这样一个缺点,即:当特征太多时,计算的负荷会非常大. 下面是一个例子: 当我们使用x1, x2 的多次项式进行预测时,我们可以应用的很好 ...
第十四章——循环神经网络（Recurrent Neural Networks）（第一部分）
由于本章过长,分为两个部分,这是第一部分. 这几年提到RNN,一般指Recurrent Neural Networks,至于翻译成循环神经网络还是递归神经网络都可以.wiki上面把Recurrent ...
第十四章——循环神经网络（Recurrent Neural Networks）（第二部分）
本章共两部分,这是第二部分: 第十四章--循环神经网络(Recurrent Neural Networks)(第一部分) 第十四章--循环神经网络(Recurrent Neural Networks) ...
循环神经网络(RNN, Recurrent Neural Networks)介绍（转载）
循环神经网络(RNN, Recurrent Neural Networks)介绍这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neur ...
循环神经网络(RNN, Recurrent Neural Networks)介绍
原文地址: http://blog.csdn.net/heyongluoyao8/article/details/48636251# 循环神经网络(RNN, Recurrent Neural Netw ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 5) Neural Networks Learning
本栏目内容来自Andrew NG老师的公开课:https://class.coursera.org/ml/class/index 一般而言, 人工神经网络与经典计算方法相比并非优越, 只有当常规方法解 ...
Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning
原文 http://blog.csdn.net/abcjennifer/article/details/7758797 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
今天开始学模式识别与机器学习(PRML)，章节5.1，Neural Networks神经网络-前向网络。
今天开始学模式识别与机器学习Pattern Recognition and Machine Learning (PRML),章节5.1,Neural Networks神经网络-前向网络. 话说上一次写 ...

随机推荐

取当前的地址栏的Url和url中的参数
看到这样一段代码: exports.showLogin = function (req, res) { req.session._loginReferer = req.headers.referer; ...
CNN 手写数字识别
1. 知识点准备在了解 CNN 网络神经之前有两个概念要理解,第一是二维图像上卷积的概念,第二是 pooling 的概念. a. 卷积关于卷积的概念和细节可以参考这里,卷积运算有两个非常重要特性, ...
Android开发环境的调研
在大二下,由于课程需要,就去自学Java,当时就借了一本java面向对象的书来看,根据书上的说明搭建环境,下载了JDK1.6和eclipse.但从来没有用过eclipse,java也就只是刚入门而已. ...
MOTT的学习（一）
MQTT的消息体 flag 此标志设置时,客户端或服务器尝试重新publish,PUBREL,subcribe或unsubscribe消息.这适用于消息, 其中的QoS的值大于零(0),并且需要确认. ...
【OpenCV入门教程之一】安装OpenCV：OpenCV 3.0 +VS 2013 开发环境配置
图片太多,具体过程参照: [OpenCV入门教程之一] 安装OpenCV:OpenCV 3.0.OpenCV 2.4.8.OpenCV 2.4.9 +VS 开发环境配置说下我这边的设置: 选择deb ...
css学习归纳总结
来源于:trigkit4 css学习归纳总结(一) 选择器的分组 CSS选择器分为 1.群组选择器如:p, body, img, div{} 2.兄弟选择器如:p + p { color:#f00 ...
G-nav-01
<body><header id="masthead" class="masthead" role="banner"> ...
读JS高级API笔记_(DOM&&DOM2&&DOM3)哎呀——园龄才9个月啊
---恢复内容开始--- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http: ...
『jQuery』.html(),.text()和.val()的概述及使用
转自http://www.jb51.net/article/35867.htm 如何使用jQuery中的.html(),.text()和.val()三种方法,用于读取,修改元素的html结构,元素的文 ...
JAVA的整型与字符串相互转换
1如何将字串 String 转换成整数 int? A. 有两个方法: 1). int i = Integer.parseInt([String]); 或 i = Integer.parseInt([S ...

Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation

Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation的更多相关文章

随机推荐

热门专题