1 VC维的定义

VC维其实就是第一个break point的之前的样本容量。标准定义是：对一个假设空间，如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开，则称该假设空间能够把N个样本打散；假设空间的VC维就是它能打散的最大样本数目N。若对任意N，总存在一组样本使得假设空间能将它们打散，则函数集的VC维是无穷大：

几种假设空间的VC维如下：

2 推导d维感知机的VC维

这里将证明，d维感知机的vc维是d+1。

第一步，证明 dvc >= d + 1。

要证明 dvc >= d+1，我们只需要找到一组大小是d+1数据，使它能够被d维感知机打散。

这里我们就给了这样一组数据：

想一下，什么叫打散？就是：

由于X是可逆的，因此对于任意的y，都能求出一个w。

因此就证明了 dvc >= d+1.

第二步，证明 dvc <= d + 1

要证明 dvc <= d+1，我们需要证明，d维感知机不能打散任意一组大小为d+2的数据。

我们给任意一组大小为d+2的数据：

由于每个行向量维度是d+1，因此由线性代数的结论，他们是线性相关的，即有：

现在我们取一种Dicotomy，使得圈圈叉叉与前面的系数a同号：

可以发现由于这个线性依赖，使得第d+2个数据一定是大于0的，所以我们就没办法shatter了。

因此就证明了dvc = d + 1。

3 VC维的物理意义

VC维表示的是做二分类时假设空间的自由度，是把数据集打散的能力。

我们可以用如下的方法来估计VC维：

即这个假设空间里面可调整的参数的个数。(只是一种估计的方法，有时候可能是不对的）

4 折衷

我们在选择假设空间时，如果选的假设空间VC维太小，好处是能保证Ein和Eout是PAC近似的，坏处是由于假设空间自由度太低，产生的Dichotomy太少，算法可能找不到使得Ein比较小的假设函数h;如果我们的VC维选的很大，好处是假设空间自由度高，能保证算法能找到一个Ein较小的假设函数h，坏处是我们坏事情发生的概率增大了（过拟合了，Ein很小但Eout很大）。

5 模型复杂度

对VCbound进行相应的变形（过程略），我们可以得到（其中根号式Ω称为模型复杂度）：

因此我们有如下图：

即vc维增大时，由于产生了更多的Dichotomy，因此Ein通常会下降，但是坏事发生的几率变大了；

vc维减小时，坏事发生的几率减小了，但是Dichotomy比较少，算法的选择有限，因此Ein通常不会太好。

因此最好的vc维是介于中间的。

6 VC-bound是宽松的

按照vcbound, 如果我们要求泛化误差ε是0.1，并且要求坏事发生的几率为0.1，我们可以推出：

然而实际上，我们并不需要这么多数据，通常只需要：

这是因为，VC bound是一个很宽松的上界，宽松表现为以下四点：

《机器学习基石》---VC维的更多相关文章

机器学习基石7-The VC Dimension
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释.机器能够学习必须满 ...
机器学习基石：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
机器学习基石笔记：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
【转载】VC维的来龙去脉
本文转载自火光摇曳原文链接:VC维的来龙去脉目录: 说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number o ...
机器学习基石12-Nonlinear Transformation
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道上一节课介绍了分类问题的三种线性模型,可以用来解决binary classif ...
机器学习基石9-Linear Regression
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道上节课,主要介绍了在有noise的情况下,VC Bound理论仍然是成立的.同 ...
VC维的来龙去脉——转载
VC维的来龙去脉——转载自“火光摇曳” 在研究VC维的过程中,发现一篇写的很不错的VC维的来龙去脉的文章,以此转载进行学习. 原文链接,有兴趣的可以参考原文进行研究学习目录: 说说历史 Hoeffd ...
VC维的来龙去脉(转)
本文转自VC维的来龙去脉本文为直接复制原文内容,建议阅读原文,原文排版更清晰,且原网站有很多有意思的文章. 阅读总结: 文章几乎为台大林老师网课“机器学习可行性”部分串联总结,是一个很好的总结. H ...
VC维与DNN的Boundary
原文链接:解读机器学习基础概念:VC维来去作者:vincentyao 目录: 说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effecti ...

随机推荐

dapper支持DataSet
在源代码中添加 /// <summary> /// describe:支持 DataSet /// </summary> /// <param name="cn ...
【动态规划DP】传娃娃-C++
传娃娃描述学习空闲之余,小信经常带着同学们做游戏,最近小信发明了一个好玩的新游戏:n 位同学围成一个圈,同学 A 手里拿着一个布娃娃.小信喊游戏开始,每位手里拿着娃娃的同学可以选择将娃娃传给左边或 ...
BI之路学习笔记3--olap cube理解实例
为什么会产生OLAP? 随着数据库技术的发展应用,数据库存储的数据量从M字节以及G(千兆)字节过渡到T字节和P字节,同时,用户的查询需求也越来越复杂,设计的已不仅是查询或者操纵一张关系表中的一条或几条 ...
ASP.NET CORE配置用户密码验证
在 class Startup 中配置 public void ConfigureServices(IServiceCollection services) { services.AddDbConte ...
Java map笔记
Map 是一个键值对的集合花和尚豹子头鲁智深林冲如果想要从map中获得值,可以根据键 Map<Key,velue> Map虽然是集合,但是和collection的接口无关我们可 ...
Android解决RecyclerView中的item显示不全方案
最近的项目中实现订单确定页面.需要使用ScrollView嵌套RecyclerView,当RecyclerView中的item数量比较多时,就会出现item只显示一部分数据,并没有将用户勾选的商品数量 ...
[PTA] 数据结构与算法题目集 6-12 二叉搜索树的操作集
唯一比较需要思考的删除操作: 被删除节点有三种情况: 1.叶节点,直接删除 2.只有一个子节点,将子节点替换为该节点,删除该节点. 3.有两个子节点,从右分支中找到最小节点,将其值赋给被删除节点的位置 ...
Redis 学习笔记（篇六）：数据库
Redis 是一个使用 C 语言编写的 NoSql 的数据库,本篇就讲解在 Redis 中数据库是如何存储的?以及和数据库有关的一些操作. Redis 中的所有数据库都保存在 redis.h/redi ...
python课堂整理13---函数的作用域及匿名函数
name = 'alex' def foo(): name = 'jinling' def bar(): print(name) return bar a = foo() print(a) 阅读上述代 ...
一文彻底搞懂Java中的环境变量
一文搞懂Java环境变量记得刚接触Java,第一件事就是配环境变量,作为一个初学者,只知道环境变量怎样配,在加上各种IDE使我们能方便的开发,而忽略了其本质的东西,只知其然不知其所以然,随着不断的深 ...

《机器学习基石》---VC维