机器学习基石的泛化理论及VC维部分整理（第六讲）

第六讲

第五讲主要讲了机器学习可能性，两个问题，（1）\(E_{in} 要和 E_{out}\) 有很接近，（2）\(E_{in}\)要足够小。

对于第一个假设，根据Hoefding's Inequality 可以得到，\( P[|E_{in} - E_{out}| > \epsilon] < 2Mexp(-2\epsilon^2N)\)

对于上述的\(M\)来说，如果 \(M < \infty\)，则当\(N\)足够大时，\(P\)会比较小，也就是坏事情出现的概率比较小，机器学习是可能的，但是当\(M = \infty\)时，就无法进行学习了。

那怎么办？考虑到or的过程中有不少重叠的部分，就从数据的角度来看到底有多少种可能的 effective Hypothesis，多少种可能的Hypothesis就是成长函数的值，Break Point的概念也就出来了，就是当\(m_{\mathcal{H}}(k) < 2^k\)，\(k\)就是Break Point。 Break Point有什么用呢？

本节引出一个新概念，Break Function，是指最小的Break Point \(k\)，Growth Function 可能的最大值，记为\(B(N,k)\)。

当\( k = 1\)时，\( B(N,1) = 2^0 = 1\)

当\( k > N\)时，\(B(N,k) = 2^{N}\)

当\( k = N\)时，\(B(N,k) = 2^{N} - 1\)，最大的可能值

根据上述两条会得到一个矩阵的一部分数据，

重点要考虑\( k < N\)的情况，怎么算呢？林老师给出一个图示，在第六讲的12页-17页，

\(B(4,3)\) 可以有11个可能的Hypothesis，对于Break Point是3来说，应该只能Shattered 2个点的情况，2个点的所有情况是4，那么如果遮住\(x_{4}\)，再去重之后应该不超过\(2B(3,3)\)。

也就是说，从三个点扩展到四个点的过程中，只有部分的dichotomy被复制了，我们把这部分被复制的点的个数称为\(\alpha\)，没被复制的点的个数称为\(\beta\)。满足\(0\leq \alpha, \beta \leq B(3,3)\)。可知 \( B(3,3) \geq \alpha + \beta , B(4,3) = 2\alpha + \beta\) ，单独看\(\alpha\)部分，因为Break Point是 3，故任何三个都不能被Shattered，那么，如果只看\(\alpha\)部分，则，\( x_{1}, x_{2}, x_{3}\) 中任意两个都不能被Shattered，（如果可以，加上\(x_{4}\)则有3个点被Shattered）则，\(\alpha \leq B(3,2) \)，有如下三个结果：

（1） \( B(4,3) = 2\alpha + \beta\)

（2）\( B(3,3) \geq \alpha + \beta\)

（3） \(B(3,2) \geq \alpha\)

综合上面三个公式，可得：

\( B(4,3) \leq B(3,3) + B(3,2)\)

推广得：\( B(N,k) \leq B(N-1,k) + B(N-1, k-1)\)

根据数学归纳法，

\( B(N,k) \leq \sum_{i=0}^{k-1}\binom{N}{i}\)

从上面这个式子可以更为欣喜的得到，之前的概率上界是可以在多项式里的，这样当\(N\) 足够大时，出现坏事情的概率就会比较小。这样学习就会更为可行。

下面就要去求解一个上界：VC Bound

want:

\( P[ \exists h \in \mathcal{H} s.t. |E_{in}(h) - E_{out}(h)| > \epsilon] \leq 2 m_{\mathcal{H}}(N) exp(-2\epsilon^2N)\)

机器学习基石的泛化理论及VC维部分整理（第六讲）的更多相关文章

机器学习基石的泛化理论及VC维部分整理（第五讲）
第五讲 Training versus Testing 一.问题的提出 \(P_{\mathcal{D}}\left [ BAD \mathcal{D} \right ] \leq 2M \cd ...
机器学习基石的泛化理论及VC维部分整理
第四讲机器学习的可行性一.Hoeffding's Inequality \(P[\left | \nu -\mu \right |>\epsilon ] \leq 2exp(-2\epsi ...
机器学习基石笔记：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
【机器学习基石笔记】七、vc Dimension
vc demension定义: breakPoint - 1 N > vc dimension, 任意的N个,就不能任意划分 N <= vc dimension,存在N个,可以任意划分只 ...
《机器学习基石》---VC维
1 VC维的定义 VC维其实就是第一个break point的之前的样本容量.标准定义是:对一个假设空间,如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开,则称该假设空间能够把N个 ...
机器学习基石7-The VC Dimension
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释.机器能够学习必须满 ...
机器学习基石：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
【转载】VC维的来龙去脉
本文转载自火光摇曳原文链接:VC维的来龙去脉目录: 说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number o ...
机器学习基石12-Nonlinear Transformation
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道上一节课介绍了分类问题的三种线性模型,可以用来解决binary classif ...

随机推荐

【技巧性（+递归运用）】UVa 1596 - Bug Hunt
In this problem, we consider a simple programming language that has only declarations of onedimensio ...
CF 19D - Points 线段树套平衡树
题目在这: 给出三种操作: 1.增加点(x,y) 2.删除点(x,y) 3.询问在点(x,y)右上方的点,如果有相同,输出最左边的,如果还有相同,输出最低的那个点分析: 线段树套平衡树. 我们先离散 ...
诡异的问题“该字符串未被识别为有效的 DateTime”
问题描述:"该字符串未被识别为有效的 DateTime"这个异常相信大家都会碰到,但是这一次真的无法理解,服务器运行一段时间之后才会出现这个问题,并且是系统中所有和日期相关的模块, ...
写在十年 2007-09-15 （写给L之三）
你知道吗? 那种时间很远,但心很近的感觉. 时间已经远去了十年, 但亲切的感觉依然清晰可见, 无论时光远去了十年,二十年,三十年, 永远…… 它已经植根,在心间……
HTML5之图形变换
- Transformations scale(0.5,0.5) 缩放 rotate(0.175) 旋转 translate(100,50) 位移 - 代码结构 context.scale(x, y) ...
iOS 非ARC基本内存管理系列 1-引用计数器
1.什么是内存管理移动设备的内存极其有限,每个app所能占用的内存是有限制的当app所占用的内存较多时,系统会发出内存警告,这时得回收一些不需要再使用的内存空间.比如回收一些不需要使用的对象.变量 ...
小技巧：SystemTray中进行操作提示
SystemTray中进行操作提示在wp中应用比较广泛,截图如下. 实现方法也十分简单 1.xaml代码中写入: shell:SystemTray.IsVisible="True" ...
DEDECMS中，arclist标签
文档列表 dede:arclist 标签: {dede:arclist flag='h' typeid='' row='' col='' titlelen='' infolen='' imgwidt ...
STM32F10XXX 启动设置
在STMF103XXX 里,可以通过Boot[1:0]引脚选择3种不同的启动模式: 启动模式选择引脚启动模式说明 BOOT1 BOOT ...
Unity学习笔记(3):获取对象
在上一篇文章中(Unity映射注册)中概要介绍了Unity中的映射机制,本节主要介绍对象获取,包括默认获取,通过名称获取,获取全部对象,同时通过加载配置文件,然后再获取对象. 通过代码获取对象方式1 ...

机器学习基石的泛化理论及VC维部分整理（第六讲）

机器学习基石的泛化理论及VC维部分整理（第六讲）的更多相关文章

随机推荐

热门专题