Jensen 不等式定义

若 \(f(x)\) 为区间 \(I\) 上的下凸函数,则对于任意 \(x_{i} \in I\) 和满足 \(\displaystyle\sum_{i=1}^{n} \lambda_{i} = 1\) 的 \(\lambda_{i} \gt 0 \left( i = 1, 2, \cdots, n \right)\),成立

\[f \left( \sum_{i=1}^{n} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{n} \lambda_{i}f(x_{i})
\]

特别地,取 \(\displaystyle\lambda_{i} = \frac{1}{n} \left( i = 1, 2, \cdots, n \right)\),就有

\[f \left( \frac{1}{n} \sum_{i=1}^{n} x_{i} \right) \leqslant \frac{1}{n} \sum_{i=1}^{n} f(x_{i})
\]

Jensen 不等式证明

使用下凸函数的定义和数学归纳法证明。

  1. 当 \(n = 1\),有 \(\lambda_{1} = 1\),则 \(f(\lambda_{1}x_{1}) \leqslant \lambda_{1}f(x_{1})\),Jensen 不等式成立。

  2. 当 \(n = 2\),\(f(x)\) 为下凸函数,根据下凸函数定义,有 \(\forall \lambda \in \left(0,1 \right): f(\lambda x_{1} + \left(1-\lambda\right) x_{2}) \leqslant \lambda f(x_{1}) + \left(1-\lambda\right) f(x_{2})\)。令 \(\lambda_{1} = \lambda\),则 \(\lambda_{2} = 1 - \lambda\),得

    \(f(\lambda_{1}x_{1} + \lambda_{2}x_{2}) \leqslant \lambda_{1}f(x_{1}) + \lambda_{2}f(x_{2})\),Jensen 不等式成立。

  3. 假设当 \(n = k\),不等式成立,即

\[\begin{equation}
f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{k} \lambda_{i}f(x_{i})
\end{equation}
\]
  1. 当 \(n = k + 1\),由命题条件 \(\displaystyle\sum_{i=1}^{k+1} \lambda_{i} = 1\) 可得 \(\displaystyle 1-\lambda_{k+1} = \sum_{i=1}^{k}\lambda_{i}\)。\(\forall \lambda_{i} \gt 0\),所以 \(1- \lambda_{k+1} \neq 0\)
\[\begin{equation} \label{eqn:one}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right) &= f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} + \lambda_{k+1}x_{k+1} \right) \\
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \dfrac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
\end{aligned}
\end{equation}
\]

考察 \(\displaystyle\frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\),只要其属于 \(I\),就可以直接使用下凸函数定义。\(x_{i}\) 是任意给定的,不妨设 \(x_{1} \lt x_{2} \lt \cdots x_{k} \lt x_{k+1}\)。所以有

\[\begin{equation}
\begin{aligned}
&\sum_{i=1}^{k} \lambda_{i} x_{1} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{k} \\
\implies & x_{1} \sum_{i=1}^{k} \lambda_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant x_{k} \sum_{i=1}^{k} \lambda_{i} \\
\implies & x_{1} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \\
\implies & x_{1} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k}
\end{aligned}
\end{equation}
\]

由于 \(x_{1}\) 和 \(x_{k}\) 都属于 \(I\),则 \(\displaystyle \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\) 也属于 \(I\)。所以可以对 \(\eqref{eqn:one}\) 式使用下凸函数的定义

\[\begin{equation} \label{eqn:two}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \begin{split} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \end{split} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
\end{aligned}
\end{equation}
\]

由于 \(\displaystyle\sum_{i=1}^{k} \frac{\lambda_{i}}{1 - \lambda_{k+1}} = 1\),符合 \(n=k\) 时 Jensen 不等式成立条件,所以有 \(\displaystyle f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) \leqslant \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right)\),代入 \(\eqref{eqn:two}\) 式可以得到 Jensen 不等式成立

\[\begin{equation}
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k} \lambda_{i} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k+1} \lambda_{i} f \left( x_{i} \right)
\end{aligned}
\end{equation}
\]
  1. 综上所述,由数学归纳法得 \(\forall n \left( n = 1, 2, \cdots, k, k+1, \cdots \right)\) 有
\[\begin{equation} \label{eqn:final}
f \left( \sum_{i=1}^{n} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{n} \lambda_{i}f(x_{i})
\end{equation}
\]

即 Jensen 不等式成立。

  1. 直接将 \(\displaystyle\lambda_{i} = \frac{1}{n}\) 代入 \(\eqref{eqn:final}\) 式,可得
\[f \left( \frac{1}{n} \sum_{i=1}^{n} x_{i} \right) \leqslant \frac{1}{n} \sum_{i=1}^{n} f(x_{i})
\]

Jensen 不等式证明的更多相关文章

  1. 机器学习数学|微积分梯度jensen不等式

    机器学习中的数学 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记 索引 微积分,梯度和Jensen不等式 Tay ...

  2. Jensen 不等式

    若f(x)为区间I上的下凸(上凸)函数,则对于任意xi∈I和满足∑λi=1的λi>0(i=1,2,...,n),成立: \[f(\sum ^{n} _{i=1} \lambda _{i}x_{i ...

  3. 归并排序、jensen不等式、非线性、深度学习

    前言 在此记录一些不太成熟的思考,希望对各位看官有所启发. 从题目可以看出来这篇文章的主题很杂,这篇文章中我主要讨论的是深度学习为什么要"深"这个问题.先给出结论吧:"深 ...

  4. 数学分析中jensen不等式由浅入深进行教学(转)

    中国知网:数学分析中Jensen不等式由浅入深进行教学

  5. 【数学基础篇】---详解极限与微分学与Jensen 不等式

    一.前述 数学基础知识对机器学习还有深度学习的知识点理解尤为重要,本节主要讲解极限等相关知识. 二.极限 1.例子 当 x 趋于 0 的时候,sin(x) 与 tan(x) 都趋于 0. 但是哪一个趋 ...

  6. 从Jensen不等式到Minkowski不等式

    整理即证 参考资料: [1].琴生不等式及其加权形式的证明.Balbooa.https://blog.csdn.net/balbooa/article/details/79357839.2018.2 ...

  7. schwarz( 施瓦兹)不等式证明

    证明 如果: 函数 y=ax^2+2bx+c 对任意x >=0 时 y>=0; 函数图象在全部x轴上方,故二次方程判别式 b^2-4ac<=0;(即方程无实数解) 即(2b)^2&l ...

  8. 凸函数与Jensen不等式

    这个是在凸优化里面看的,在EM算法中看有用到,所以用latex写了篇回忆用的小短文,现在不会把latex产生的pdf怎么转变成放到这里的内容. 所以我选择直接贴图. 这个pdf可以在我的资源里找到.  ...

  9. MT【23】用算术几何不等式证明数列极限存在

    评:如果不需要精确到3,上界的求法可以利用$$(1+\frac{1}{n})^n*\frac{1}{2}*\frac{1}{2}<(\frac{n+\frac{1}{n}*n+\frac{1}{ ...

  10. Jensen不等式

随机推荐

  1. SpringBoot内容协商机制

    1.是什么? SpringBoot内容协商机制是一种实现了内容协商(Content Negotiation)的Web服务器,它可以根据客户端请求的不同,将响应返回给客户端. 在传统的Web服务器中,如 ...

  2. LeetCode224:基本计算器(栈)

    解题思路: 1.双栈模拟,一个用来存数,一个用来存操作符.需要考虑 '('后面紧跟'+'.'-'这种情况 2.递归:遇到左括号开始递归,遇到右括号结束递归,返回值. 1 class Solution: ...

  3. bash shell笔记整理——date命令

    date命令初步了解 简单来说date的主要作用大多数用于以给定的格式来显示时间. 在后期我们写一些脚本当中也会使用到,比如说按照日期来给文件备份打包等. 下面我们来看看帮助信息: [root@ngi ...

  4. quill富文本编辑器quill粘贴图片上传服务器

    强大的富文本编辑器:quill github:32k start++,:https://github.com/quilljs/quill quill粘贴图片上传服务器 <link href=&q ...

  5. 容器处于`Pending`状态Warning FailedScheduling <unknown> default-scheduler 0/10 nodes are available

    Warning FailedScheduling default-scheduler 0/10 nodes are available: 1 node(s) had taint {agreeml: a ...

  6. 温故而知新——MYSQL基本操作

    相关连接: mysql和sqlserver的区别:https://www.cnblogs.com/vic-tory/p/12760197.html sqlserver基本操作:https://www. ...

  7. Java 在Excel中添加筛选器并执行筛选

    以下内容介绍通过Java程序在Excel添加筛选器并执行筛选.程序需要使用Excel工具类库Free Spire.XLS for Java,本文中使用的是免费版,可在官网下载jar包,解压导入jar文 ...

  8. MySQL进阶篇:详解索引使用_最左前缀法则

    MySQL进阶篇:第四章_四.一_ 索引使用_最左前缀法则 最左前缀法则 如果索引了多列(联合索引),要遵守最左前缀法则.最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列.如果跳跃某一列 ...

  9. 云图说 | MSSI之应用业务模型ABM,搭建业务与技术的数据治理桥梁

    摘要:应用业务模型ABM(Application Business Model)是MSSI为客户提供的统一模型管理服务. 本文分享自华为云社区<[云图说] | 第274期 MSSI之应用业务模型 ...

  10. KubeEdge在国家工业互联网大数据中心的架构设计与应用

    摘要:在18年的时候,工信部开展了一个叫国家创新发展工程,这个工程中提出了要建立一个国家工业大数据中心,中国移动在其中承担了边缘协同与数据采集相关功能的研发.本文将从该项目背景下面临的问题与挑战.技术 ...