【The VC Dimension】林轩田机器学习基石

首先回顾上节课末尾引出来的VC Bound概念，对于机器学习来说，VC dimension理论到底有啥用。

三点：

1. 如果有Break Point证明是一个好的假设集合

2. 如果N足够大，那么Ein跟Eout的表现会比较接近

3. 如果算法A选的g足够好（Ein很小），则可能从数据中学到了东西

==================================================

现在正式引出VC Dimension的概念：啥叫VC Dimension:

VC Dimension是针对某个假设集合的一个性质。简言之，就是Break Point - 1的那个值的正式说法。如果没有Break Point，则VC Dimension是无限。

因此，VC Dimension有限被认为是好的。

为啥是好的呢？回顾之前几节的内容，有如下的结论证明VC Dimension有限是好的（样本充足情况下，可以保证Eout跟Ein接近）

马上举一个例子，证明VC Dimension的用处：

对于2D PLA来说：

1. 如果是linear separable D ，则迭代次数足够，一定可以得到Ein(out)是0 （从训练集学到了东西）

2. 二维平面上 binary classification的VC Dimension是3，因此N足够大时候，Ein与Eout很接近（训练集的学习效果可以迁移到测试集）

端午放假出去散心。。。回来接着写。。。。

=======================================================================

在分析了1D perceptron和2D perceptron之后，猜测是否d-D perceptron的VC Dimension是d+1维呢？（这个猜测是可以证明成立的）

需要证明如下的式子：

先从第一个开始：

需要证明N=d+1时，某些情况下是可以shatter的即可。课件中举了这个例子：

举了这个例子，因为矩阵X是可逆的，不管Y的d+1维分量怎么取值（取0或1）组合，都可以求出来这样一个W。所以，证明了有些情况下d+1个inputs是可以被shatter的。

到这里，对可逆是咋回事已经要忘记了。

翻了翻课件（矩阵分析课程的）：

那么林的课件中的矩阵是依据啥构造出来的呢？我觉得是依据“A的行/列线性无关”这一条等价的性质构造出来的。

线性相关、无关是啥啊？

再翻一翻课件：

跟记忆中的差不多。

矩阵各种性质和运算操作太重要了，但是不想打断林这个课程的学习。搜到一个Brown大学的矩阵程序开发课程https://www.coursera.org/course/matrix，用python编写矩阵的各种操作，后续一定补上。

再证明后半部分：

1. 如果输入是d+2维的，那么一定可以构造出来第d+2个行向量是1~d+1个行向量的线性表示

2. 这时，如果WTX1~WTXd+1与其前面的系数a1~ad+1同号，则等式一定是大于零的；

3. 因此这个时候Yd+2就一定得是1，不可能取到0；也就是说，当Y1~Yd+1的取值跟a1~ad+1同号的情况下，Yd+2符号是定死的，所以Yd+2取不全01，因此无法shatter

下面看了DC Dimension的physical intuition

"effective binary" degree of freedom

可以粗略地理解为：free parameters

更深入了解一下VC Dimension的意义，主要从VC Bound入手。

可以集成到下面几张PPT中：

1. VC Bound是对模型复杂度的一个惩罚项

2. 可以根据VC Dimension来确定需要多大的样本量（实际经验一般是10倍的OK的）

3. VC Bound虽然是个非常宽松的Bound，但是却是一个通用性很强的Bound.

【The VC Dimension】林轩田机器学习基石的更多相关文章

（转载）林轩田机器学习基石课程学习笔记1 — The Learning Problem
(转载)林轩田机器学习基石课程学习笔记1 - The Learning Problem When Can Machine Learn? Why Can Machine Learn? How Can M ...
【Theory of Generalization】林轩田机器学习基石
紧接上一讲的Break Point of H.有一个非常intuition的结论,如果break point在k取到了,那么k+1, k+2,... 都是break point. 那么除此之外,我们还 ...
【Hazard of Overfitting】林轩田机器学习基石
首先明确了什么是Overfitting 随后,用开车的例子给出了Overfitting的出现原因出现原因有三个: (1)dvc太高,模型过于复杂(开车开太快) (2)data中噪声太大(路面太颠簸) ...
【Linear Regression】林轩田机器学习基石
这一节开始讲基础的Linear Regression算法. (1)Linear Regression的假设空间变成了实数域 (2)Linear Regression的目标是找到使得残差更小的分割线(超 ...
【 Logistic Regression 】林轩田机器学习基石
这里提出Logistic Regression的角度是Soft Binary Classification.输出限定在0~1之间,用于表示可能发生positive的概率. 具体的做法是在Linear ...
【Training versus Testing】林轩田机器学习基石
接着上一讲留下的关子,机器学习是否可行与假设集合H的数量M的关系. 机器学习是否可行的两个关键点: 1. Ein(g)是否足够小(在训练集上的表现是否出色) 2. Eout(g)是否与Ein(g)足够 ...
【Feasibility of Learning】林轩田机器学习基石
这一节的核心内容在于如何由hoeffding不等式关联到机器学习的可行性. 这个PAC很形象又准确,描述了“当前的可能性大概是正确的”,即某个概率的上届. hoeffding在机器学习上的关联就是: ...
【Perceptron Learning Algorithm】林轩田机器学习基石
直接跳过第一讲.从第二讲Perceptron开始,记录这一讲中几个印象深的点: 1. 之前自己的直觉一直对这种图理解的不好,老按照x.y去理解. a) 这种图的每个坐标代表的是features:fea ...
林轩田机器学习基石课程学习笔记5 — Training versus Testing
上节课,我们主要介绍了机器学习的可行性.首先,由NFL定理可知,机器学习貌似是不可行的.但是,随后引入了统计学知识,如果样本数据足够大,且hypothesis个数有限,那么机器学习一般就是可行的.本节 ...

随机推荐

修改hosts工具推荐SwitchHosts
推荐一个修改hosts的工具.适合平时工作中经常修改hosts的开发测试. 下载地址:https://oldj.github.io/SwitchHosts/ 可以按各种环境或者项目添加,用的时候打开或 ...
Gym 100090M Jumping along the Hummocks
题意: 从前往后跳,要么跳一步,跳到相邻的位置,要么跳到下一个数字相同的位置,求跳到最后的最少步数. dp,但是会tle,我用map优化了一下. #include <bits/stdc++.h ...
Spring boot 集成Spring Security
依赖jar <dependency> <groupId>org.springframework.cloud</groupId> <artifactId> ...
update_TypeError
TypeError: ( 'An update must have the same type as the original shared variable ( shared_var=W, shar ...
P2341 [HAOI2006]受欢迎的牛
P2341 [HAOI2006]受欢迎的牛塔尔羊标准模板(我才不会告诉你我嘴里含着一个九省联考的出题人) 不会劈配.林克卡特树.制胡窜我还会叉粪宿主,梳妆素组,西安段素 #include<c ...
前端css样式及选择器
标题: 1.scc概述 2.行内样式 3.内接样式 4.外接样式(链接式) 推荐使用 5.外接样式(导入式) 6.嵌套规则 7.css选择器 1.scc(Cascading Style Shee ...
C++声明之CV限定符
目录 1.const 1.1 const obj 如果调用 non-const member fun会编译出错经典错误 1.2 例子:STD里的操作符重载 1.3 例子:<cpp primer ...
Spring Boot Common application properties(转载)
转自官方文档:http://docs.spring.io/spring-boot/docs/current/reference/html/common-application-properties.h ...
MySQL跟踪SQL&慢查询分析工具
简介之前的工作一直使用的SQL SERVER, 用过的都知道,SQL SERVER有配套的SQL跟踪工具SQL Profiler,开发或者定位BUG过程中,可以在操作页面的时候,实时查看数据库执行的 ...
sqlite的sql常用语句（笔记）
1.复制一张表并重命名比如已经创建好一个表表名为"28165" 复制这个表. CREATE TABLE [33150] AS SELECT * FROM [28165] 2.根 ...

【The VC Dimension】林轩田机器学习基石

【The VC Dimension】林轩田机器学习基石的更多相关文章

随机推荐

热门专题