Jensen 不等式定义

若 \(f(x)\) 为区间 \(I\) 上的下凸函数,则对于任意 \(x_{i} \in I\) 和满足 \(\displaystyle\sum_{i=1}^{n} \lambda_{i} = 1\) 的 \(\lambda_{i} \gt 0 \left( i = 1, 2, \cdots, n \right)\),成立

\[f \left( \sum_{i=1}^{n} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{n} \lambda_{i}f(x_{i})
\]

特别地,取 \(\displaystyle\lambda_{i} = \frac{1}{n} \left( i = 1, 2, \cdots, n \right)\),就有

\[f \left( \frac{1}{n} \sum_{i=1}^{n} x_{i} \right) \leqslant \frac{1}{n} \sum_{i=1}^{n} f(x_{i})
\]

Jensen 不等式证明

使用下凸函数的定义和数学归纳法证明。

  1. 当 \(n = 1\),有 \(\lambda_{1} = 1\),则 \(f(\lambda_{1}x_{1}) \leqslant \lambda_{1}f(x_{1})\),Jensen 不等式成立。

  2. 当 \(n = 2\),\(f(x)\) 为下凸函数,根据下凸函数定义,有 \(\forall \lambda \in \left(0,1 \right): f(\lambda x_{1} + \left(1-\lambda\right) x_{2}) \leqslant \lambda f(x_{1}) + \left(1-\lambda\right) f(x_{2})\)。令 \(\lambda_{1} = \lambda\),则 \(\lambda_{2} = 1 - \lambda\),得

    \(f(\lambda_{1}x_{1} + \lambda_{2}x_{2}) \leqslant \lambda_{1}f(x_{1}) + \lambda_{2}f(x_{2})\),Jensen 不等式成立。

  3. 假设当 \(n = k\),不等式成立,即

\[\begin{equation}
f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{k} \lambda_{i}f(x_{i})
\end{equation}
\]
  1. 当 \(n = k + 1\),由命题条件 \(\displaystyle\sum_{i=1}^{k+1} \lambda_{i} = 1\) 可得 \(\displaystyle 1-\lambda_{k+1} = \sum_{i=1}^{k}\lambda_{i}\)。\(\forall \lambda_{i} \gt 0\),所以 \(1- \lambda_{k+1} \neq 0\)
\[\begin{equation} \label{eqn:one}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right) &= f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} + \lambda_{k+1}x_{k+1} \right) \\
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \dfrac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
\end{aligned}
\end{equation}
\]

考察 \(\displaystyle\frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\),只要其属于 \(I\),就可以直接使用下凸函数定义。\(x_{i}\) 是任意给定的,不妨设 \(x_{1} \lt x_{2} \lt \cdots x_{k} \lt x_{k+1}\)。所以有

\[\begin{equation}
\begin{aligned}
&\sum_{i=1}^{k} \lambda_{i} x_{1} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{k} \\
\implies & x_{1} \sum_{i=1}^{k} \lambda_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant x_{k} \sum_{i=1}^{k} \lambda_{i} \\
\implies & x_{1} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \\
\implies & x_{1} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k}
\end{aligned}
\end{equation}
\]

由于 \(x_{1}\) 和 \(x_{k}\) 都属于 \(I\),则 \(\displaystyle \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\) 也属于 \(I\)。所以可以对 \(\eqref{eqn:one}\) 式使用下凸函数的定义

\[\begin{equation} \label{eqn:two}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \begin{split} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \end{split} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
\end{aligned}
\end{equation}
\]

由于 \(\displaystyle\sum_{i=1}^{k} \frac{\lambda_{i}}{1 - \lambda_{k+1}} = 1\),符合 \(n=k\) 时 Jensen 不等式成立条件,所以有 \(\displaystyle f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) \leqslant \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right)\),代入 \(\eqref{eqn:two}\) 式可以得到 Jensen 不等式成立

\[\begin{equation}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k} \lambda_{i} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k+1} \lambda_{i} f \left( x_{i} \right)
\end{aligned}
\end{equation}
\]
  1. 综上所述,由数学归纳法得 \(\forall n \left( n = 1, 2, \cdots, k, k+1, \cdots \right)\) 有
\[\begin{equation} \label{eqn:final}
f \left( \sum_{i=1}^{n} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{n} \lambda_{i}f(x_{i})
\end{equation}
\]

即 Jensen 不等式成立。

  1. 直接将 \(\displaystyle\lambda_{i} = \frac{1}{n}\) 代入 \(\eqref{eqn:final}\) 式,可得
\[f \left( \frac{1}{n} \sum_{i=1}^{n} x_{i} \right) \leqslant \frac{1}{n} \sum_{i=1}^{n} f(x_{i})
\]

Jensen 不等式证明的更多相关文章

  1. 机器学习数学|微积分梯度jensen不等式

    机器学习中的数学 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记 索引 微积分,梯度和Jensen不等式 Tay ...

  2. Jensen 不等式

    若f(x)为区间I上的下凸(上凸)函数,则对于任意xi∈I和满足∑λi=1的λi>0(i=1,2,...,n),成立: \[f(\sum ^{n} _{i=1} \lambda _{i}x_{i ...

  3. 归并排序、jensen不等式、非线性、深度学习

    前言 在此记录一些不太成熟的思考,希望对各位看官有所启发. 从题目可以看出来这篇文章的主题很杂,这篇文章中我主要讨论的是深度学习为什么要"深"这个问题.先给出结论吧:"深 ...

  4. 数学分析中jensen不等式由浅入深进行教学(转)

    中国知网:数学分析中Jensen不等式由浅入深进行教学

  5. 【数学基础篇】---详解极限与微分学与Jensen 不等式

    一.前述 数学基础知识对机器学习还有深度学习的知识点理解尤为重要,本节主要讲解极限等相关知识. 二.极限 1.例子 当 x 趋于 0 的时候,sin(x) 与 tan(x) 都趋于 0. 但是哪一个趋 ...

  6. 从Jensen不等式到Minkowski不等式

    整理即证 参考资料: [1].琴生不等式及其加权形式的证明.Balbooa.https://blog.csdn.net/balbooa/article/details/79357839.2018.2 ...

  7. schwarz( 施瓦兹)不等式证明

    证明 如果: 函数 y=ax^2+2bx+c 对任意x >=0 时 y>=0; 函数图象在全部x轴上方,故二次方程判别式 b^2-4ac<=0;(即方程无实数解) 即(2b)^2&l ...

  8. 凸函数与Jensen不等式

    这个是在凸优化里面看的,在EM算法中看有用到,所以用latex写了篇回忆用的小短文,现在不会把latex产生的pdf怎么转变成放到这里的内容. 所以我选择直接贴图. 这个pdf可以在我的资源里找到.  ...

  9. MT【23】用算术几何不等式证明数列极限存在

    评:如果不需要精确到3,上界的求法可以利用$$(1+\frac{1}{n})^n*\frac{1}{2}*\frac{1}{2}<(\frac{n+\frac{1}{n}*n+\frac{1}{ ...

  10. Jensen不等式

随机推荐

  1. 解决win10的wifi打不开或无法搜索到周围wifi的问题

    今天笔者遇到了一个比较奇葩的问题,就是笔记本电脑的wifi打不开了,即使打开了也是搜索不到周围的wifi的.这个问题一开始笔者没有发现,因为在暑假期间都是使用笔记本连接自己的手机热点进行上网的.然而暑 ...

  2. 深入理解 Docker 核心原理:Namespace、Cgroups 和 Rootfs

    通过这篇文章你可以了解到 Docker 容器的核心实现原理,包括 Namespace.Cgroups.Rootfs 等三个核心功能. 如果你对云原生技术充满好奇,想要深入了解更多相关的文章和资讯,欢迎 ...

  3. 结合 element -Plus组件库,压缩图片大小,限制图片格式

    业务背景:业务上需求满足上传的图片不能太大,但是有时候上传的图片确实超过了限制大小,所以前端这边可以将图片压缩再上传,亦或者是上传给后端接口的图片只能是指定格式,我们前端需要将图片后缀转化,也可以处理 ...

  4. ElasticSearch之Index stats API

    获取指定索引的统计数据. 获取指定索引的全部统计数据,命令样例如下: curl -X GET "https://localhost:9200/testindex_001/_stats?pre ...

  5. Springboot3核心特性

    一.简介 1. 前置知识 Java17 Spring.SpringMVC.MyBatis Maven.IDEA 2. 环境要求 环境&工具 版本(or later) SpringBoot 3. ...

  6. 【scikit-learn基础】--『监督学习』之 贝叶斯分类

    贝叶斯分类是一种统计学分类方法,基于贝叶斯定理,对给定的数据集进行分类.它的历史可以追溯到18世纪,当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理,这个定理为统计决策提供了理论基础. 不过,贝叶斯分类 ...

  7. H3C 存储换盘操作

    实际存储型号H3C CF8844 环境说明:H3C存储设备存在一个坏盘需要更换. 更换准备 1. 取出备件检查完毕后放置到安全场所(请严格按照<IT产品现场工程师通用服务规(维修篇)>操作 ...

  8. startx详解

    linux下startx命令详解 用途 初始化一个 X 会话. 语法 startx [ -d Display:0 ] [ -t | -w ] [ -x Startup | [ -r Resources ...

  9. electron入门之配置镜像加速(四)

    electron入门到入土,配置阿里镜像加速.为了防止后面我们打包龟速,需要给electron配置阿里镜像加速 在下面的文件内添加阿里镜像加速,你的文件位置不一定是这个 C:\Program File ...

  10. MySQL基础篇:第九章_详解流程控制结构

    流程控制结构 系统变量 一.全局变量 作用域:针对于所有会话(连接)有效,但不能跨重启 查看所有全局变量 SHOW GLOBAL VARIABLES; 查看满足条件的部分系统变量 SHOW GLOBA ...