原文地址：https://www.jianshu.com/p/f2f4d509060e

机器学习是设计算法$A$，在假设集合$H$里，根据给定数据集$D$，选出与实际模式$f$最为相近的假设$g$（$g$可能与$f$相同，也可能不同）。
那什么情况下学习是可行的？即保证$g$和$f$是相似的。

数据集内的表现$g$约等于$f$;
$g$在数据集外的表现约等于$g$在数据集内的表现。

结合1、2可保证，由算法在给定数据集上学习到的$g$（即数据集内的表现$g$约等于$f$）在数据集外的表现也约等于$f$，即$g$与$f$相似。

一、如何保证2？

数据集内表现相同的多个假设在数据集外的部分数据上表现相差极大，即学习效果极差。

霍夫丁不等式：有一个装有绿色小球和橘色小球的罐子（假设球数无限），从中进行$N$次有放回的取球实验，在这$N$次实验中取出橘色小球的频率为$\nu$，只要$N$足够大，就可以用$\nu$来估计$\mu$即罐子中橘色小球的实际概率。

将霍夫丁不等式与学习相联系。当$h$选定时，只要$D$里样本数$N$足够大且样本点独立同分布，就能保证$h$在整个输入空间里的表现（异常点的概率）与数据集内的表现（$D$里异常点的频率）在一定的概率范围内近似相等。

注意，$E_{out}(h)$实际是面向整个输入空间的，即数据集$D$内和数据集$D$外。

二、如何保证1？

$A$根据$D$在$H$中选出使得$E_{in}(h)$小的$h$。

注意，2的保证是在给定$h$的情况下，即$h$的选择只有1个。
但是，1的保证需要在$H$中进行选择，如果$H$的$size>1$，即$h$有很多个，可能有限也可能无限，那么2的保证是否会受到影响呢？
坏数据：对于一个$h$，使得$h$在该数据内外表现差异很大的数据认为是坏数据。
可以理解为霍夫丁不等式的左式中概率衡量的事件：$E_{in}(h)$和$E_{out}(h)$的差异大于容忍度$\epsilon$，即对于一个$h$，存在坏数据的概率小于等于霍夫丁的右式。
对于一个输入空间$X$，能够产生的用于训练的数据$D$有很多个，若对于一个$h$，给定的数据刚好就是坏数据的概率是小于等于霍夫丁的右式的；若有$M$个$h$，给定的数据是其中某个$h$的坏数据的概率是小于等于数据为$h_1$的坏数据的概率+数据为$h_2$的坏数据的概率+数据为$h_3$的坏数据的概率+......+数据为$h_M$的坏数据的概率。本质是求并集（小于等于的原因是有可能存在交集）。这里的$M$实际是$|H|$，即$H$的$size$。

只要$M$是有限值、$N$足够大，不等式的右式就能足够小。
所以，
只要假设集大小有限、$N$足够大------保证$E_{in}$和$E_{out}$的差异在容忍度内，
$A$根据$D$在$H$中挑选出$g$------保证$E_{in}$小，
就能说学习是PAC可能的。

但是，如果输入空间$X$是无限的，那理论上对应的$H$的数量也是无限的，即当$|H|$无限大时，该怎么办呢？

机器学习基石笔记：04 Feasibility of Learning的更多相关文章

林轩田机器学习基石笔记4—Feasibility of Learning
上节课介绍了机器学习可以分为不同的类型.其中,监督式学习中的二元分类和回归分析是最常见的也是最重要的机器学习问题.本节课,我们将介绍机器学习的可行性,讨论问题是否可以使用机器学习来解决. 一.Lear ...
机器学习基石笔记：01 The Learning Problem
原文地址:https://www.jianshu.com/p/bd7cb6c78e5e 什么时候适合用机器学习算法? 存在某种规则/模式,能够使性能提升,比如准确率: 这种规则难以程序化定义,人难以给 ...
林轩田机器学习基石笔记3—Types of Learning
上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA.PLA能够在平面中选择一条直线将样本数据完全正确分类.而对于线性不可分的情况,可以使用Pocket Algorithm来处理.本节课将主要 ...
机器学习基石笔记：16 Three Learning Principles
三个理论上界: 三个线性模型: 三个关键工具: 三条学习规则: 1.奥卡姆剃刀定律先从简单模型开始, 训练后出现欠拟合, 再尝试复杂点模型. 2.采样误差训练.验证.测试数据尽量同分布. 3.数据 ...
机器学习基石第一讲：the learning problem
博客已经迁移至Marcovaldo's blog (http://marcovaldong.github.io/) Andrew Ng的Machine Learning比較简单,已经看完.林田轩的机器 ...
林轩田机器学习基石笔记2—Learning to Answer Yes/No
机器学习的整个过程:根据模型H,使用演算法A,在训练样本D上进行训练,得到最好的h,其对应的g就是我们最后需要的机器学习的模型函数,一般g接近于目标函数f.本节课将继续深入探讨机器学习问题,介绍感知机 ...
林轩田机器学习基石笔记1—The Learning Problem
机器学习分为四步: When Can Machine Learn? Why Can Machine Learn? How Can Machine Learn? How Can Machine Lear ...
机器学习基石笔记：02 Learning to Answer Yes/No、PLA、PA
原文地址:https://www.jianshu.com/p/ed0aee74523f 一.Perceptron Learning Algorithm (一)算法原理 PLA本质是二元线性分类算法,即 ...
机器学习基石笔记：03 Types of Learning
原文地址:https://www.jianshu.com/p/86b2a9cef742 一.学习的分类根据输出空间$Y$:分类(二分类.多分类).回归.结构化(监督学习+输出空间有结构): 根据 ...

随机推荐

git - 1.基础
配置 C:\Users\Administrator λ git config --global user.name 'tangsansan' C:\Users\Administrator λ git ...
spring boot 2.0 配置双数据源 MySQL 和 SqlServer
参考:https://www.cnblogs.com/xiaofengfeng/p/9552816.html 安装 org.mybatis.spring.boot:mybatis-spring-boo ...
linux上部署JMeter
export JAVA_HOME=/opt/jdk1.8.0_171 export PATH=$PATH:$JAVA_HOME/bin 让环境变量生效 vi /etc/profile 添加下述两行: ...
UOJ#104. 【APIO2014】Split the sequence 动态规划斜率优化
原文链接www.cnblogs.com/zhouzhendong/p/UOJ104.html 题解首先证明一个结论:对于一种分割方案,分割的顺序不影响最终结果. 证明:对于树 a[x] 和 a[y] ...
ImCash:币安下架BSV之辩：规则、中立与去中心化
一种看法是:一个引用价格数据和执行交易的加密货币交易所,其业务决策往往是在链外发生的,不受制于严格的.类似于准宪法的链上规则的约束,加密货币交易所可以拒绝任何人喜欢的价格和交易,而且这样做并不会损害底 ...
结对开发项目--石家庄地铁web版
一.功能要求 1.数据库设计:将石家庄地铁线路图的各个线路,各个站点,换乘信息等用数据库的形式保存起来,应该保存的信息有 {线路号,线路的各个站名,车站的换乘信息}. 2.站点查询:用户可以输入任一一 ...
防御xss 大致理解
前端发送留言内容包含 js 代码后台管理员查看留言代码被执行拿到cookie 成功登陆解决办法对录入进行相关的过滤处理其他解决方法正在学习中
python基础----1. globals和locals
官方文档 globals """ Return a dictionary representing the current global symbol table. Th ...
jquery固定表头和列头
1.对网上的开源方法稍作了些修改 <script type="text/javascript">// <![CDATA[ function FixTable(Ta ...
FTP连接超时
今天程序在连接FTP服务器,突然无法连接,用Windows 的 Explorer能正常连接,但用 WebRequest.WebResponse连接时,总是抛出连接超时异常. 后查找相关资料,原因是:程 ...

机器学习基石笔记：04 Feasibility of Learning

一、如何保证2？

二、如何保证1？

机器学习基石笔记：04 Feasibility of Learning的更多相关文章

随机推荐

热门专题