马尔可夫不等式

结论

  对于任意非负随机变量$X$,$\forall \epsilon>0$,有:

$\displaystyle P(X\ge\epsilon)\le\frac{E(X)}{\epsilon}$

  切比雪夫不等式是它的特例。

证明

$ \begin{align*} E(X) &= \int_{0}^{\infty}xf(x)dx\\ &\ge \int_{\epsilon}^{\infty}xf(x)dx\\ &\ge \int_{\epsilon}^{\infty}\epsilon f(x)dx\\ &=\epsilon P(X\ge \epsilon)\\ \end{align*}$

  把$\epsilon$除过去,得证。离散情况一样。

霍夫丁不等式引理

结论

  对于随机变量$X$,$P(X\in [a,b]) = 1,E(X)=0$,有:

$E(e^{sX})\le e^{s^2(b-a)^2/8}$

证明

  因$e^{sX}$是关于$X$的凸函数,由凸函数性质:

$\displaystyle e^{sX}\le \frac{b-X}{b-a}e^{sa}+\frac{X-a}{b-a}e^{sb}$

  于是对$X$取期望,有:

$ \begin{align*} \displaystyle E(e^{sX}) &\le \frac{b-E(X)}{b-a}e^{sa}+\frac{E(X)-a}{b-a}e^{sb}\\ & = \frac{b}{b-a}e^{sa}-\frac{a}{b-a}e^{sb}\\ & = \left(-\frac{a}{b-a}\right)e^{sa}\left(-\frac{b}{a}+e^{sb-sa}{}\right)\\ \end{align*}$

  因为$E(X)=0$,$X\in [a,b]$,而$a,b$都为0的情况没有讨论的意义,所以有$a<0,b>0$。令$\displaystyle\theta = -\frac{a}{b-a}>0$,则上式变为:

$ \begin{align*} \displaystyle E(e^{sX}) &\le \theta e^{-s\theta (b-a)}\left(\frac{1}{\theta}-1+e^{s(b-a)}\right)\\ &=(1-\theta + \theta e^{s(b-a)})e^{-s\theta(b-a)}\\  \end{align*}$

  因为

$ \begin{gather} \displaystyle 1-\theta+\theta e^u = \theta(\frac{1}{\theta}-1+e^u) = \theta(-\frac{a}{b}+e^u)>0 \label{} \end{gather} $

  所以不等式可以变为:

$\displaystyle E(e^{sX})\le e^{\ln(1-\theta + \theta e^{s(b-a)})}e^{-s\theta(b-a)}$

  令$u = s(b-a)$:

$E(e^{sX})\le e^{\ln(1-\theta+\theta e^u)-\theta u}$

  定义$\varphi:R\to R,\varphi(u)= \ln(1-\theta+\theta e^u)-\theta u$。由$(1)$式可得这个函数是良定义的,也就是$\varphi(u)$的$\ln$并不限制$u$的取值。得:

$E(e^{sX})\le e^{\varphi(u)}$

  由泰勒中值定理,$\exist\xi\in [0,u]$使

$\displaystyle\varphi(u)=\varphi(0)+u\varphi'(0)+\frac{1}{2}u^2\varphi''(\xi)$

  其中:

$ \begin{equation} \begin{array}{lcl} \varphi(0) = 0 \\ \varphi'(0)= \left.\left(\frac{\theta e^u}{1-\theta+\theta e^u}-\theta\right)\right|_{u=0}=0  \\ \begin{split} \varphi''(\xi) &= \frac{\theta e^{\xi}(1-\theta+\theta e^{\xi})-\theta^2 e^{2\xi}}{(1-\theta+\theta e^{\xi})^2} \\ &=\frac{\theta e^{\xi}}{1-\theta+\theta e^{\xi}}(1-\frac{\theta e^{\xi}}{1-\theta+\theta e^{\xi}})\\ &=t(1-t)\le\frac{1}{4} \end{split} \end{array} \end {equation} $

  因此有:

$\displaystyle\varphi(u)\le 0+0+\frac{1}{2}u^2\times\frac{1}{4} = \frac{1}{8}s^2(b-a)^2$

  于是

$E(e^{sX})\le e^{s^2(b-a)^2/8}$

霍夫丁不等式

结论

  wiki的定义:

  霍夫丁不等式适用于有界的随机变量。设有两两独立的一系列随机变量$X_{1},\dots ,X_{n}$。假设对所有的$X_{i}$都是几乎有界(看成有界就好了)的变量,即满足:

$\displaystyle P(X_{i}\in [a_{i},b_{i}])=1$

  那么这n个随机变量的经验期望(均值):

$\displaystyle \overline{X} = \frac{X_1+\cdots+X_n}{n}$

  满足以下不等式:

$\displaystyle  P(\overline{X}-E(\overline{X})\ge t) \le \exp\left(- \frac{2t^2n^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

$\displaystyle  P(|\overline{X}-E(\overline{X})|\ge t) \le 2 \exp\left(- \frac{2t^2n^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

证明

  对于$X_1,X_2,...,X_n$,$n$个相互独立的随机变量(wiki里面说是两两独立,我感觉两两独立$X_i$乘积的期望应该不能分离成期望的乘积,这里我不太明确),$P(X_i\in [a_i,b_i])=1,1\le i\le n$,令

$\displaystyle S_n=\sum\limits_{i=1}^{n}X_i$

  取$s>0,t>0$,由马尔科夫不等式得:

$\begin{align*} P(S_n-E(S_n)\ge t) &= P(e^{s(S_n-E(S_n))}\ge e^{st})\\ &\le e^{-st}E(e^{s(S_n-E(S_n))}) \\ &= e^{-st}\prod\limits_{i=1}^{n}E(e^{s(X_i-E(X_i))}) \end {align*}$

  再由引理得:

$ \begin{align*} P(S_n-E(S_n)\ge t) &\le e^{-st}\prod\limits_{i=1}^{n} e^{\frac{s^2(b_i-a_i)^2}{8}}\\ &=\exp(-st+\frac{1}{8}s^2\sum\limits_{i=1}^n(b_i-a_i)^2) \end {align*}$

  到这一步,不等式中还多出了一个$s$,因为$\forall s>0$,都有以上不等式成立,因此取右边关于$s$的二次函数的最小值。令

$\displaystyle g(s)=-st+\frac{1}{8}s^2\sum\limits_{i=1}^n(b_i-a_i)^2$

  求$g'(s)=0$,得:

$\displaystyle  s = \frac{4t}{\sum_{i=1}^{n}(b_i-a_i)^2}$

  于是:

$\displaystyle P(S_n-E(S_n)\ge t) \le \exp\left(- \frac{2t^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

  变换成$X_i$的均值$\overline{X}$,也就是:

$\displaystyle  P(\overline{X}-E(\overline{X})\ge t) \le \exp\left(- \frac{2t^2n^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

  取反后依然成立:

$\displaystyle  P(E(\overline{X})-\overline{X}\ge t) \le \exp\left(- \frac{2t^2n^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

  合到一起:

$\displaystyle  P(|\overline{X}-E(\overline{X})|\ge t) \le 2 \exp\left(- \frac{2t^2n^2}{\sum_{i=1}^{n}(b_i-a_i)^2}\right)$

  得证。

霍夫丁(Hoeffding)不等式证明的更多相关文章

  1. 机器学习笔记--Hoeffding霍夫丁不等式

    Hoeffding霍夫丁不等式 在<>第八章"集成学习"部分, 考虑二分类问题\(y \in \{-1, +1\}\) 和真实函数\(f\), 假定基分类器的错误率为\ ...

  2. 【BZOJ】1002:轮状病毒(基尔霍夫矩阵【附公式推导】或打表)

    Description 轮状病毒有很多变种,所有轮状病毒的变种都是从一个轮状基产生的.一个N轮状基由圆环上N个不同的基原子和圆心处一个核原子构成的,2个原子之间的边表示这2个原子之间的信息通道.如下图 ...

  3. CF 463A && 463B 贪心 && 463C 霍夫曼树 && 463D 树形dp && 463E 线段树

    http://codeforces.com/contest/462 A:Appleman and Easy Task 要求是否全部的字符都挨着偶数个'o' #include <cstdio> ...

  4. BZOJ 4031 HEOI2015 小Z的房间 基尔霍夫矩阵+行列式+高斯消元 (附带行列式小结)

    原题链接:http://www.lydsy.com/JudgeOnline/problem.php?id=4031 Description 你突然有了一个大房子,房子里面有一些房间.事实上,你的房子可 ...

  5. bzoj1002 轮状病毒 暴力打标找规律/基尔霍夫矩阵+高斯消元

    基本思路: 1.先观察规律,写写画画未果 2.写程序暴力打表找规律,找出规律 1-15的答案:1    5    16    45    121 320 841     2205   5776 151 ...

  6. 疯子的算法总结(九) 图论中的矩阵应用 Part 2 矩阵树 基尔霍夫矩阵定理 生成树计数 Matrix-Tree

    定理: 1.设G为无向图,设矩阵D为图G的度矩阵,设C为图G的邻接矩阵. 2.对于矩阵D,D[i][j]当 i!=j 时,是一条边,对于一条边而言无度可言为0,当i==j时表示一点,代表点i的度. 即 ...

  7. 赫夫曼\哈夫曼\霍夫曼编码 (Huffman Tree)

    哈夫曼树 给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离 ...

  8. python数字图像处理(16):霍夫圆和椭圆变换

    在极坐标中,圆的表示方式为: x=x0+rcosθ y=y0+rsinθ 圆心为(x0,y0),r为半径,θ为旋转度数,值范围为0-359 如果给定圆心点和半径,则其它点是否在圆上,我们就能检测出来了 ...

  9. python数字图像处理(15):霍夫线变换

    在图片处理中,霍夫变换主要是用来检测图片中的几何形状,包括直线.圆.椭圆等. 在skimage中,霍夫变换是放在tranform模块内,本篇主要讲解霍夫线变换. 对于平面中的一条直线,在笛卡尔坐标系中 ...

  10. bzoj 1002 [FJOI2007]轮状病毒 高精度&&找规律&&基尔霍夫矩阵

    1002: [FJOI2007]轮状病毒 Time Limit: 1 Sec  Memory Limit: 162 MBSubmit: 2234  Solved: 1227[Submit][Statu ...

随机推荐

  1. LLM论文研读: MindSearch

    1. 背景 近日中科大与上海人工智能实验室联合推出的MindSearch思索,引起了不小的关注,github上的星标,短短几周时间,已经飙到了4.2K.看来确实有些内容,因此本qiang~研读了论文及 ...

  2. 爬虫案例2-爬取视频的三种方式之一:requests篇(1)

    @ 目录 前言 爬虫步骤 确定网址,发送请求 获取响应数据 对响应数据进行解析 保存数据 完整源码 共勉 博客 前言 本文写了一个爬取视频的案例,使用requests库爬取了好看视频的视频,并进行保存 ...

  3. C++:使自定义类支持迭代器

    概述 在 C++ 中,链表迭代器是一种用来遍历链表(如 std::list)元素的工具.链表是一种数据结构,其中每个元素(节点)包含一个数据值和一个指向下一个节点的指针.链表迭代器允许以类似于数组的方 ...

  4. 音视频基础知识|ANS 噪声抑制原理解析

    ​ 在上一期课程<音视频开发进阶课程|第二讲:回声消除>中,我们接触了音频前处理的概念,还认识了音频前处理的三剑客之一 AEC 回声消除.今天,我们继续来认识三剑客中的第二位:噪声抑制 A ...

  5. Azure 入门系列 (第二篇 Backup 和 Disaster Recovery)

    本系列 这个系列会介绍从 0 到 1 搭建一个 Web Application 的 Server. 间中还会带上一些真实开发常用的功能. 一共 6 篇 1. Virtual Machine (VM) ...

  6. uniCloud

    https://doc.dcloud.net.cn/uniCloud/ 什么是uniCloud uniCloud推出了opendb,包含了大量的开源数据库模板,常见数据表无需自己设计 uniCloud ...

  7. MyBatis动态增改,多字段模糊查询

    示例: insert insert into bargain_products <trim prefix="(" suffix=")" suffixOve ...

  8. Hadoop完全分布式搭建,基于乌班图系统

    因为现在集成的工具很多,建议在接触这一块的过程中还是自己找几个主机,亲手搭一遍集群,更好的熟悉底层!本文只是搭建的过程没有理论!手搭集群时先将各节点网络.ssh配置好!然后在一台机子上操作配置文件,直 ...

  9. 高强度学习训练第七天总结:JVM分配内存机制

    理解JVM内存分配策略 三大原则+担保机制 JVM分配内存机制有三大原则和担保机制 具体如下所示: 优先分配到eden区 大对象,直接进入到老年代 长期存活的对象分配到老年代 空间分配担保 对象优先在 ...

  10. 9月《中国数据库行业分析报告》已发布,47页干货带你详览 MySQL 崛起之路!

    为了帮助大家及时了解中国数据库行业发展现状.梳理当前数据库市场环境和产品生态等情况,从2022年4月起,墨天轮社区行业分析研究团队出品将持续每月为大家推出最新<中国数据库行业分析报告>,持 ...