StanFord ML 笔记第六部分&&第七部分

第六部分内容：

　　1.偏差/方差（Bias/variance）

　　2.经验风险最小化（Empirical Risk Minization，ERM）

　　3.联合界（Union bound）

　　4.一致收敛（Uniform Convergence）

第七部分内容：

　　1. VC 维

　　2.模型选择(Model Selection)

　　2017.11.3注释：这两个部分都是讲述理论过程的，第一方面太难了，第二方面现在只想快速理解Ng的20节课程。所以这部分以后回头再看！

　 2017.11.4注释：这理论还是得掌握，不然看Ng视频干嘛？直接去操作TF算了啊。。。。

　　1.偏差/方差（Bias/variance）

　　　　https://www.gitbook.com/book/yoyoyohamapi/mit-ml/details，这个是比较简单的，偷懒不写了。

　　2.经验风险最小化（Empirical Risk Minization，ERM）

　　　　定义一个线性分类器

　　　　其中（note ）

　　　　假设有m个训练样本，样本之间是独立同分布的。

　　　　定义训练误差：

　　　　训练误差也被称为风险。

　　　　经验风险最小化：选择分类器函数的参数，使得分类器的训练误差（training error）最小。

　　　　让我们换一种考虑方式：我们不是在选择最优分类器函数的参数，而是在选择最优的分类器函数。

　　　　定义假设类

　　　　假设类的每一个成员都是参数n+1个的线性分类器函数。

　　　　重新定义ERM：从假设类H中选取一个函数，使得分类器的训练误差最小。

　　　　实际上，我们并不关心训练误差的大小，我们关心的是分类器对于未知样本的预测能力，也就是一般误差（generation error）：

　　3.联合界（Union bound）

　　　　注释：这里的两个定理证明很麻烦，直接用就可以了，联合界定理很简单不用叙述，Hoeffding 不等式表示试验次数越多均值越趋向真实的值，比如实验10000次硬币，那就正反的比例为1:1。

　　　　3.1.联合界引理（Union Bound）：

　　　　　　令表示k个事件，这些事件不一定是独立的，

　　　　3.2.Hoeffding 不等式：

　　　　　　假设Z1,…,Zm为m个独立同分布（iid,independent and identically distributed）的随机变量,服从于伯努利分布，即

　　　　　　并且

　　　　　　为这些随机变量的均值，给定，那么有

　　　　　　表达的是对真实分布的估计值与真实分布之间的差值大于的概率的上界，这个上界随着m的增加而指数下降。

　　　　　　考虑具有有限假设类的情形：猜想类H具有k个假设

　　　　　　ERM会从H中选出具有最小训练误差的假设

　　　　注释：对Hoeffding 不等式的简单解释如下-->>

　　　　　　Hoeffding不等式是关于一组随机变量均值的概率不等式。如果X1,X2,⋯,Xn为一组独立同分布的参数为p的伯努利分布随机变量，n为随机变量的个数。定义这组随机变量的均值为：

　　　　　　对于任意δ>0, Hoeffding不等式可以表示为

　　　　　　上面的公式似乎写的不是很详细，所以我又从网上copy了一份其他的解释：

　　　　　　Hoeffding不等式：Hoeffding不等式好像有很多个形式，all of statistics里的感觉较难理解，这里写一种好理解的。令X1,…,Xn为独立同分布随机变量，满足ai≤Xi≤bi。则对于任意t>0有

　　　　　　其中：

　　　　　　至于这个公式怎么证明，就不要为难自己了~

　　　　　　而这个公式的用途：

　　　　　　在统计推断中，我们可以利用样本的统计量(statistic)来推断总体的参数(parameter)，譬如使用样本均值来估计总体期望。如下图所示，我们从罐子里抽球，希望估计罐子里红球和绿球的比例。

　　　　　　直觉上，如果我们有更多的样本(抽出更多的球)，则样本期望ν应该越来越接近总体期望μ。事实上，这里可以用hoeffding不等式表示如下：

　　　　　　从hoeffding不等式可以看出，当n逐渐变大时，不等式的UpperBound越来越接近0，所以样本期望越来越接近总体期望。

　　4.一致收敛（Uniform Convergence）　　　

　　　　4.1. 训练误差是一个对一般误差的很好的近似

　　　　　　首先证明第一项，从猜想类H中任意选取一个假设 ,定义

　　　　　　服从伯努利分布，因此

　　　　　　其均值是假设的一般误差。

　　　　　　训练误差为

　　　　　　由Hoeffding不等式可知

　　　　　　假设m很大，即训练样本很多，那么训练误差将会以很大概率近似于一般误差。

　　　　　　定义事件为发生

　　　　　　有

　　　　　　那么对于整个猜想类来说

　　　　　　两边同时用1减去

　　　　　　也就是说，在不小于的概率下，对于猜想类H中的所有假设h，其训练误差和一般误差之间的差距将会在以内。

　　　　　　这被称为 一致收敛。

　　　　4.2. ERM选择的假设的一般误差存在上界

　　　　　　定义

　　　　　　那么给定和解出

　　　　　　意思是，只要你的训练集合包含至少上述m这么多的样本，那么概率至少在下，有对H中的所有假设成立。

　　　　　　样本复杂度：为了达到一个特定的错误的界，你需要多大的训练集合。

　　　　　　误差界：

　　　　　　同样的，我们可以固定m和，得到

　　　　　　定义为H中具有最小一般误差的假设，为H中具有最小训练误差的假设，那么至少在的概率下，有

　　　　　　也就是说，我们选择的（具有最小训练误差的）假设的一般误差，和具有最小一般误差的假设的一般误差之间的差值存在的上界。

　　　　　　直观上，我们可以把第一项看成是选择假设的偏差，第二项看成选择假设的方差。

　　　　　　当我们将H替换为更复杂的猜想类H'，即H是H'的子集时，第一项只会变的更小，即偏差变小；而由于k的增大，第二项会变的更大，即方差变大。

　　　　　　将一切总结为两个定理如下：

第七部分：

　　7.1VC维空间，VC界讲的很棒

　　　　　 http://www.flickering.cn/machine_learning/2015/04/vc%E7%BB%B4%E7%9A%84%E6%9D%A5%E9%BE%99%E5%8E%BB%E8%84%89/

　　7.2模型选择

　　　　7.1.1.交叉验证

　　　　　　训练和测试相互参照

　　　　7.1.2特征选择

　　　　　　控制变量，去观察别的变量对结果的影响

　　　　7.1.3特征过滤

　　　　　　计算特征X_i和Y的相关程度，然后再通过交叉验证去排除

参考：http://blog.csdn.net/u013656184/article/details/50178573

　　　 http://www.cnblogs.com/madrabbit/p/7095575.html#undefined

StanFord ML 笔记第六部分&&第七部分的更多相关文章

StanFord ML 笔记第三部分
第三部分: 1.指数分布族 2.高斯分布--->>>最小二乘法 3.泊松分布--->>>线性回归 4.Softmax回归指数分布族: 结合Ng的课程,在看这篇博文 ...
StanFord ML 笔记第八部分
第八部分内容: 1.正则化Regularization 2.在线学习(Online Learning) 3.ML 经验 1.正则化Regularization 1.1通俗解释引用知乎作者:刑无刀 ...
StanFord ML 笔记第五部分
1.朴素贝叶斯的多项式事件模型: 趁热打铁,直接看图理解模型的意思:具体求解可见下面大神给的例子,我这个是流程图. 在上篇笔记中,那个最基本的NB模型被称为多元伯努利事件模型(Multivariate ...
StanFord ML 笔记第一部分
本章节内容: 1.学习的种类及举例 2.线性回归,拟合一次函数 3.线性回归的方法: A.梯度下降法--->>>批量梯度下降.随机梯度下降 B.局部线性回归 C.用概率证明损失函数( ...
StanFord ML 笔记第十部分
第十部分: 1.PCA降维 2.LDA 注释:一直看理论感觉坚持不了,现在进行<机器学习实战>的边写代码边看理论
StanFord ML 笔记第九部分
第九部分: 1.高斯混合模型 2.EM算法的认知 1.高斯混合模型之前博文已经说明:http://www.cnblogs.com/wjy-lulu/p/7009038.html 2.EM算法的认知 ...
StanFord ML 笔记第四部分
第四部分: 1.生成学习法 generate learning algorithm 2.高斯判别分析 Gaussian Discriminant Analysis 3.朴素贝叶斯 Navie Baye ...
StanFord ML 笔记第二部分
本章内容: 1.逻辑分类与回归 sigmoid函数概率证明---->>>回归 2.感知机的学习策略 3.牛顿法优化 4.Hessian矩阵牛顿法优化求解: 这个我就不记录了,看到一 ...
Android群英传笔记——第六章：Android绘图机制与处理技巧
Android群英传笔记--第六章:Android绘图机制与处理技巧一直在情调,时间都是可以自己调节的,不然世界上哪有这么多牛X的人今天就开始读第六章了,算日子也刚好一个月了,一个月就读一半,这效 ...

随机推荐

NET设计模式第三部分结构型模式(7)：适配器模式（Adapter Pattern）
适配器模式(Adapter Pattern) ——.NET设计模式系列之八 Terrylee,2006年2月概述在软件系统中,由于应用环境的变化,常常需要将“一些现存的对象”放在新的环境中应用,但 ...
HanLP用户自定义词典源码分析详解
1. 官方文档及参考链接 l 关于词典问题Issue,首先参考:FAQ l 自定义词典其实是基于规则的分词,它的用法参考这个issue l 如果有些数量词.字母词需要分词,可参考:P2P和C2C这种词 ...
VGA原理
VGA原理 1.VGA时序 2.不同的显示标准,有不同的水平段和垂直段 3.像素时钟和帧频的关系联系目前调试的1080i 50Hz: 像素时钟为148.5MHz, 水平段周期 = 2640 X (1 ...
XML 增、删、改
作为一个小型的数据存储传递的工具——XML,大家肯定也不陌生,今天就关于XML的一些简单操作做些总结. 这些都是在控制台进行操作的····· 1.创建XML 1)创建普通XML static void ...
关于namespace的使用
#include <string> #include <pcl/io/pcd_io.h> #include <pcl/point_types.h> int main ...
<亲测>ubuntu 16.04 忘记root密码
ubuntu 16.04 忘记root密码阅读目录方法一方法二虚拟机中安装的ubuntu 16.04. 回到目录方法一如果用户具有sudo权限,那么直接可以运行如下命令: sudo s ...
Flsk-Werkzeug-请求参数获取备忘
Werkzeug:response,request,routing 获取请求参数:data,form,args,files,cookies,headers,method,url routing:Rul ...
饿了么移动APP的架构演进
1MVC 我们常说,脱离业务谈架构就是纯粹的耍流氓.饿了么移动APP的发展也是其业务发展的一面镜子. 在饿了么业务发展的早期,移动APP经历了从无到有的阶段.为了快速上线抢占市场,传统移动APP开发的 ...
解决Sublime Text 3中文显示乱码问题
之前用Sublime Text 2,阅读了你是猴子派的救兵吗写的博客解决Sublime Text 2中文显示乱码问题,解决了问题. 后来嫌版本2启动太慢了,换成Sublime Text 3之后,发现网 ...
【剑指offer】二进制中1的个数
输入一个整数,输出该数二进制表示中1的个数.其中负数用补码表示. 思路:将原数字与1按位进行与操作. public class Solution { public int NumberOf1(int ...

StanFord ML 笔记 第六部分&&第七部分

StanFord ML 笔记 第六部分&&第七部分的更多相关文章

随机推荐

热门专题

StanFord ML 笔记第六部分&&第七部分

StanFord ML 笔记第六部分&&第七部分的更多相关文章