机器学习基石的泛化理论及VC维部分整理

第四讲机器学习的可行性

一、Hoeffding's Inequality

$P[\left | \nu -\mu \right |>\epsilon ] \leq 2exp(-2\epsilon^{2}N)$　　　　　　　　　　　　　　(1)

in-sample error, 也就是在样本里出现的error，$E_{in}$ is probably close to out-of-sample error $E_{out}$ (within $\epsilon$)

推出一个类似的公式： $P[\left | E_{in} - E_{out} \right |>\epsilon ] \leq 2exp(-2\epsilon^{2}N)$　　　　(2)

也就是说，公式（2）说明了问题可以学习的两个条件：

（1）$ E_{in} \approx E_{out}$ ：这个代表 $ E_{out}$ 要和 $ E_{in}$差不多大

（2）$ E_{in}(h) \approx 0$ ：这个代表$ E_{in}$要差不多是0

这就推出，$ h \approx f$ with respect to $P$

我们的学习思路就是，从一些hypothesis set 中找到最好的 $h$，使得$ h \approx f$

二、真实的学习

面对多个$ h $ 时，容易出现问题。

BAD Sample：$ E_{in} and E_{out} $ far away

那么，Bad Sample的概率有多大呢？我们认为，在众多的hypothesis set上的每一个$h_{i}$，只要有一个是坏的，则都是坏的

$P_{\mathfrak{D}}\left [ BAD \mathfrak{D} \right ] $

$ = P_{\mathfrak{D}}\left [ BAD \mathfrak{D} for h_{1} or BAD \mathfrak{D} for h_{2} or ... or BAD \mathfrak{D} for h_{M} \right ] $

$ \leq P_{D} \left [ BAD D for h_{1} \right ] + P_{D} \left [ BAD D for h_{2} \right] + ... + P_{D} \left [ BAD D for h_{M} \right] $

($ Union Bound $)

$ \leq 2exp(-2\epsilon^2N) + 2exp(-2\epsilon^2N) + ... + 2exp(-2\epsilon^2N) $

$ = 2M\cdot exp(-2\epsilon^2N)$

当hypothesis set为有限时，（$ M$ 固定），当$N$足够大时，因为后面的$exp(-2\epsilon^2N)$ 随着$N$增大会变得特别小，故总体值是很小的。

此时学习是有效的。

当hypothesis set 为无穷大时，$ M = \infty $ 则有问题了，具体问题下一部分讨论。

机器学习基石的泛化理论及VC维部分整理的更多相关文章

机器学习基石的泛化理论及VC维部分整理（第六讲）
第六讲第五讲主要讲了机器学习可能性,两个问题,(1)$E_{in} 要和 E_{out}$ 有很接近,(2)$E_{in}$要足够小. 对于第一个假设,根据Hoefding's Inequa ...
机器学习基石的泛化理论及VC维部分整理（第五讲）
第五讲 Training versus Testing 一.问题的提出 \(P_{\mathcal{D}}\left [ BAD \mathcal{D} \right ] \leq 2M \cd ...
机器学习基石笔记：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
【机器学习基石笔记】七、vc Dimension
vc demension定义: breakPoint - 1 N > vc dimension, 任意的N个,就不能任意划分 N <= vc dimension,存在N个,可以任意划分只 ...
《机器学习基石》---VC维
1 VC维的定义 VC维其实就是第一个break point的之前的样本容量.标准定义是:对一个假设空间,如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开,则称该假设空间能够把N个 ...
机器学习基石7-The VC Dimension
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释.机器能够学习必须满 ...
机器学习基石：07 The VC Dimension
当N大于等于2,k大于等于3时, 易得:mH(N)被Nk-1给bound住. VC维:最小断点值-1/H能shatter的最大k值. 这里的k指的是存在k个输入能被H给shatter,不是任意k个输入 ...
【转载】VC维的来龙去脉
本文转载自火光摇曳原文链接:VC维的来龙去脉目录: 说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number o ...
机器学习基石12-Nonlinear Transformation
注: 文章中所有的图片均来自台湾大学林轩田<机器学习基石>课程. 笔记原作者:红色石头微信公众号:AI有道上一节课介绍了分类问题的三种线性模型,可以用来解决binary classif ...

随机推荐

为dedecms v5.7的ckeditor添加jwplayer插件
dedecms v5.7的默认编辑器是ckeditor,不过用的是php版本的,默认的工具栏不在config.js里面配置,而是在ckeditor.inc.php里面配置,默认的工具栏是$toolba ...
转：java 类名 this 的使用
转自: http://www.cnblogs.com/PengLee/p/3993033.html 类名.class与类名.this详解类名.class 我们知道在java中,一个类在 ...
Jackson - Features for configuring Java-to-JSON mapping
Following on/off features are defined in SerializationConfig.Feature (for Jackson 1.x), or Serializa ...
ActiveMQ(5.10.0) - Destination-level authorization
To build upon authentication, consider a use case requiring more fine-grained control over clients t ...
Quartz Scheduler(2.2.1) - Working with SchedulerListeners
SchedulerListeners SchedulerListeners are much like TriggerListeners and JobListeners, except they r ...
Android经验之谈1
豌豆荚等可能会导致手机网络出现问题,电话打不进来,所以需要及时卸载豌豆荚. 系统apk,不能通过在manifest.xml里面添加origin-package或者useid等来改变. 而是需要用and ...
SQL server经典电子书、工具和视频教程汇总
SQL server经典电子书.工具和视频教程汇总 SQL server经典电子书.工具和视频教程汇总 SQL Server是高校计算机专业的一门必修课程,同时众多企业采用SQL Server作为数据 ...
signal信号类型列表
Linux支持的信号列表如下.很多信号是与机器的体系结构相关的信号值默认处理动作发出信号的原因 SIGHUP 1 A 终端挂起或者控制进程终止 SIGINT 2 A 键盘中断(如break键被按 ...
block的动态传值例子
/* 写一个block传值 ,让两个数进行相除和相乘,在运行时动态决定采用哪种计算方式 */ #import <Foundation/Foundation.h> int main(in ...
C#消息模拟
C#中消息的工作流程: C#中的消息被Application类从应用程序消息队列中取出,然后分发到消息对应的窗体,窗体对象的第一个响应函数是对象中的protected override void Wn ...

机器学习基石的泛化理论及VC维部分整理

机器学习基石的泛化理论及VC维部分整理的更多相关文章

随机推荐

热门专题