Infinite size of Hypothesis set and growth function

We want:

根据Hoeffding:

但是M是无穷大的，是否可以找到一个有穷大的m_H去替代无穷大的M？
思考：M从何而来。

Hset里有M个h，对于每个Data，只要存在一个h会造成Bad，即Ein和Eout差很远，则称该Data是一个Bad sample，因此是用or的关系。这里的upper bound之所以是可以加起来的，是因为假设了Bad sample发生在不同的h上，即h1(D1)是Bad的，h2(D1)就不会Bad。但是这种假设是不对的。例如：对于两个很接近的h，他们对于同一个Data，会产生几乎接近的Ein。

所以不能通过直接把概率相加起来的办法作为Bad产生的概率上限。
考虑：可否将线，也就是h分组。结论是可以的。
方法：对于N个x，从x_1到x_N，即使h是无限个的，但是通过这些h，把这N个x分出来的结果是有限个的，例如对于N等于2，x1和x2被分的所有可能就只有4种。00,01,10,11。

定义：一个Hset是由很多个用来区分x的h组成的，表达如下：

现在定义二分（dichotomy）：

Hset和dichotomy set的区别

定义dichotomy set的大小

这是依赖于输入的N。为了去除这种依赖，定义成长函数growth function:

怎样计算m_H(N)呢？
1D情况1：positive ray在threshold左边为－1右边＋1

m_H(N) = N+1。因为有N+1个地方可以放分割线。
情况2：在interval内为＋1，其他为－1

右边的1那一项表示没有点在interval内，即全部是－1
2D情况：在convex set内为+1，外面为－1。假设输入的N个x在一个大圆上，那么H里的所有h都可以实现不同的dichotomy。

shattered：特别的N个点，可以做出2^N个dichotomy。
总结：

定义：break point
第一个做不出2^k个dichotomy的点的个数(e.g：2d：k=4) convex set没有break point

以下的情况是h没有办法产生的dichotomy

Infinite size of Hypothesis set and growth function的更多相关文章

[Vue warn]: You may have an infinite update loop in a component render function
[Vue warn]: You may have an infinite update loop in a component render function 这个问题很奇怪,之前从来没有遇到过.如果 ...
[under the hood]Reduce EXE and DLL Size with LIBCTINY.LIB
Matt Pietrek Download the code for this article: Hood0101.exe (45KB) W ay back in my October 1996 co ...
First-class function
https://en.wikipedia.org/wiki/First-class_function In computer science, a programming language is sa ...
OpenCV Error: Assertion failed (src.size == dst.size && src.channels() == dst.channels()) in cvConvertScale
发现问题:在做kinect采集的深度图去噪的时候遇到了cvConvertScale格式转换的问题. OpenCV Error: Assertion failed (src.size == dst.si ...
机器学习基石 5 Training versus Testing
机器学习基石 5 Training versus Testing Recap and Preview 回顾一下机器学习的流程图: 机器学习可以理解为寻找到 \(g\),使得 \(g \approx f ...
Microsoft SQL Server Trace Flags
Complete list of Microsoft SQL Server trace flags (585 trace flags) REMEMBER: Be extremely careful w ...
Foundations of Machine Learning: The PAC Learning Framework(1)
写在最前:本系列主要是在阅读 Mehryar Mohri 等的最新书籍<Foundations of Machine Learning>以及 Schapire 和 Freund 的 < ...
Exercises for IN1900
Exercises for IN1900October 14, 2019PrefaceThis document contains a number of programming exercises ...
TCP拥塞控制算法优缺点适用环境性能分析
[摘要]对多种TCP拥塞控制算法进行简要说明,指出它们的优缺点.以及它们的适用环境. [关键字]TCP拥塞控制算法优点缺点适用环境公平性公平性公平性是在发生拥塞时各源端(或同一源端 ...

随机推荐

storm(二) 事务机制
前言为了保证tuple的强有序和exactly-once语义,storm提供了事务机制,为每个tuple提供一个id 设计方法1 为每个tuple设置一个事务id,在数据库保存事务id和当前处理的i ...
解决"此请求已被阻止，因为当用在 GET 请求中时，会将敏感信息透漏给第三方网站"的问题
在ASP.NET MVC项目中,使用AJAX向控制器发送GET请求获取JSON数据时,出现这个错误:"此请求已被阻止,因为当用在 GET 请求中时,会将敏感信息透漏给第三方网站.若要允许 G ...
AVL树 - 学习笔记
2017-08-29 14:35:55 writer:pprp AVL树就是带有平衡条件的二叉查找树.每个节点的左子树和右子树高度相差最多为1的二叉查找树空树的高度定为-1 对树的修正称为旋转对内 ...
VirtualBox 安装增强功能失败解决方法
参考:virtualbox安装增强功能时[未能加载虚拟光盘] 在安装VirtualBox并配置虚拟机之后,想要安装增强功能:设备 => 安装增强功能. 出现未能加载虚拟光盘问题. 解决方法: 进 ...
【异常记录(五)】C# 无法发送具有此谓词类型的内容正文错误
今天请求接口直接调了以前写好的方法,结果报了(405)不支持方法的错误,一看是GET写成POST了,改成GET之后,又报了无法发送具有此谓词类型的内容正文错误的错误原来之前的方法里面有GetRequ ...
springMvc REST 请求和响应
前言: 突然怎么也想不起来 springMvc REST 请求的返回类型了! (尴尬+究竟) 然后本着方便的想法百度了一下发现了个问题,大家在写 springMvc RES ...
Python3 学习第十三弹：模块学习五之pickle与json
对于python来说,这两个模块是十分实用的两个模块,以一种简单的方法用于储存数据实例. pickle模块提供用来储存Python各种数据序列化存储 # 原来的cPickle已经在python3中与 ...
linux-Centos7安装nginx
首先配置linux环境,我这里是刚刚装好linux,所以一次性安装了一系列我需要到的环境: yum install pcre pcre-devel zlib zlib-devel openssl op ...
linux中安装eclipse--CnetOS6.5
01.去官网下载指定的eclipse安装包 02.使用xftp把下载的eclipse安装包放入到linux系统的指定位置03.到指定的目录下!使用命令解压下载的文件tar -zxvf 文件名称04. ...
ArcGIS中标注转注记方法比较
[数据处理]ArcGIS中标注转注记方法比较 (2013-02-22 08:42:15) 转载▼ 标签: arcgis 标注注记 label annotation 分类: 数据处理 1.概述由于切 ...

Infinite size of Hypothesis set and growth function

Infinite size of Hypothesis set and growth function的更多相关文章

随机推荐

热门专题