(六) 6.1 Neurons Networks Representation

面对复杂的非线性可分的样本是，使用浅层分类器如Logistic等需要对样本进行复杂的映射，使得样本在映射后的空间是线性可分的，但在原始空间，分类边界可能是复杂的曲线。比如下图的样本只是在2维情形下的示例，假设有100维度，即特征数目是100，若使用logistic来做分类，对于这种线性不可分的情形，要对特征进行各种形式的组合映射，然后用映射后扩充的特征进行分类，可能会增加大量的参数，计算复杂性可想而知，而且可能会造成严重的over-fitting，可见logistic分类的局限性，下面引入NN。

如下是一个单层网络的示意图，类似于感知机分类器，下图有三个feature，有一个bias unit，其值始终为1，对应的参数为ϴ₀ϴ₁ϴ₂ϴ₃，最后其线性组合做一个sigmod映射来得到最终的结果

下图为含有隐藏层的Neurons Networds,a_i^(j)中的j表示层数，i表示第 i 个unit，ϴ^(j)示层j到j+1的参数矩阵ϴ_ij表示前一层的单元j到本层单元i的参数，本示例中ϴ⁽¹⁾为3*4的矩阵

更简洁的表示方法，把上一层的输入表示为z⁽ⁱ⁾, 下图中的z⁽²⁾ 分别表示上一层的activation，这三个值乘以对应的参数，然后做一个sigmod映射之后又可以当下一层的输入，最终我们的H_ϴ(x)=g(ϴ⁽²⁾*a⁽²⁾),可见最后我们不是对初始特征x₁ x₂ x₃做的运算，这可以理解为 Neurons Networks会自动组合特征，从而达到更好的效果。

最后只得注意的是，对于非线性可分的情况，NN也可以进行分类，比如XOR（异或）的情况：

参考：

Ng 2012 公开课课件

(六) 6.1 Neurons Networks Representation的更多相关文章

CS229 6.1 Neurons Networks Representation
面对复杂的非线性可分的样本是,使用浅层分类器如Logistic等需要对样本进行复杂的映射,使得样本在映射后的空间是线性可分的,但在原始空间,分类边界可能是复杂的曲线.比如下图的样本只是在2维情形下的示 ...
(六) 6.2 Neurons Networks Backpropagation Algorithm
今天得主题是BP算法.大规模的神经网络可以使用batch gradient descent算法求解,也可以使用 stochastic gradient descent 算法,求解的关键问题在于求得每层 ...
(六) 6.3 Neurons Networks Gradient Checking
BP算法很难调试,一般情况下会隐隐存在一些小问题,比如(off-by-one error),即只有部分层的权重得到训练,或者忘记计算bais unit,这虽然会得到一个正确的结果,但效果差于准确BP得 ...
（六）6.10 Neurons Networks implements of softmax regression
softmax可以看做只有输入和输出的Neurons Networks,如下图: 其参数数量为k*(n+1) ,但在本实现中没有加入截距项,所以参数为k*n的矩阵. 对损失函数J(θ)的形式有: 算法 ...
Machine Learning - 第4周（Neural Networks: Representation）
Neural networks is a model inspired by how the brain works. It is widely used today in many applicat ...
CS229 6.10 Neurons Networks implements of softmax regression
softmax可以看做只有输入和输出的Neurons Networks,如下图: 其参数数量为k*(n+1) ,但在本实现中没有加入截距项,所以参数为k*n的矩阵. 对损失函数J(θ)的形式有: 算法 ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 4) Neural Networks Representation
Andrew NG的Machine learning课程地址为:https://www.coursera.org/course/ml 神经网络一直被认为是比较难懂的问题,NG将神经网络部分的课程分为了 ...
（六）6.15 Neurons Networks Deep Belief Networks
Hintion老爷子在06年的science上的论文里阐述了 RBMs 可以堆叠起来并且通过逐层贪婪的方式来训练,这种网络被称作Deep Belife Networks(DBN),DBN是一种可以学习 ...
（六）6.11 Neurons Networks implements of self-taught learning
在machine learning领域,更多的数据往往强于更优秀的算法,然而现实中的情况是一般人无法获取大量的已标注数据,这时候可以通过无监督方法获取大量的未标注数据,自学习( self-taught ...

随机推荐

Content Providers详解
今天仔细阅读了一遍Content Providers的官方API文档,总结了一下Android中Content Providers的用法. 各种类型的Content Provider对一个结构化的数据 ...
EF框架完整项目记录
今天终于能用EF框架搭建一个项目,同时能连接sqlserver 数据库.mysql 数据库 1.必须的文件 2.将必须文件导入项目,此处用到“管理 NuGet 程序包”,由于从网上下载比较慢,此处从本 ...
Codeforces Round #337 (Div. 2) C. Harmony Analysis 数学
C. Harmony Analysis The semester is already ending, so Danil made an effort and decided to visit a ...
tomcat简介及原理解说
Tomcat简介作者:杨晓(http://blog.sina.com.cn/u/1237288325) 目录: ----Tomcat背景 ----Tomcat目录 ----Tomcat类加载 --- ...
快笑死，侯捷研究MFC的原因
与我研究VCL框架代码的原因一模一样:就是N年了,感觉自己还是没有掌握Delphi,惊叹别人各种各样神奇的效果,自己却不会,更不知为什么这样做,离高手的距离还有十万八千里.而且编程的时候,就像侯捷说的 ...
Array.prototype.slice.call(document.querySelectorAll('a'), 0)
Array.prototype.slice.call(document.querySelectorAll('a'), 0)的作用就是将一个DOM NodeList 转换成一个数组. slice()方法 ...
282. Expression Add Operators
题目: Given a string that contains only digits 0-9 and a target value, return all possibilities to add ...
281. Zigzag Iterator
题目: Given two 1d vectors, implement an iterator to return their elements alternately. For example, g ...
Java：字符串缓冲区StringBuffer和StringBuilder的使用
StringBuffer特点: 1.是字符缓冲区,一个容器(不论缓冲区内容怎么变化,StringBuffer这个容器对象都不会改变) 2.是可变长度的 3.可以直接操作多个数据类型 4.最终会通过to ...
Linux命令-wc
wc命令用于统计指定文本的行数.字数.字节数格式:wc [参数] 文本 [root@localhost test]# wc test.txt test.txt [root@localhost tes ...

(六) 6.1 Neurons Networks Representation

(六) 6.1 Neurons Networks Representation的更多相关文章

随机推荐

热门专题