Jensen 不等式证明
Jensen 不等式定义
若 \(f(x)\) 为区间 \(I\) 上的下凸函数,则对于任意 \(x_{i} \in I\) 和满足 \(\displaystyle\sum_{i=1}^{n} \lambda_{i} = 1\) 的 \(\lambda_{i} \gt 0 \left( i = 1, 2, \cdots, n \right)\),成立
\]
特别地,取 \(\displaystyle\lambda_{i} = \frac{1}{n} \left( i = 1, 2, \cdots, n \right)\),就有
\]
Jensen 不等式证明
使用下凸函数的定义和数学归纳法证明。
当 \(n = 1\),有 \(\lambda_{1} = 1\),则 \(f(\lambda_{1}x_{1}) \leqslant \lambda_{1}f(x_{1})\),Jensen 不等式成立。
当 \(n = 2\),\(f(x)\) 为下凸函数,根据下凸函数定义,有 \(\forall \lambda \in \left(0,1 \right): f(\lambda x_{1} + \left(1-\lambda\right) x_{2}) \leqslant \lambda f(x_{1}) + \left(1-\lambda\right) f(x_{2})\)。令 \(\lambda_{1} = \lambda\),则 \(\lambda_{2} = 1 - \lambda\),得
\(f(\lambda_{1}x_{1} + \lambda_{2}x_{2}) \leqslant \lambda_{1}f(x_{1}) + \lambda_{2}f(x_{2})\),Jensen 不等式成立。假设当 \(n = k\),不等式成立,即
f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{k} \lambda_{i}f(x_{i})
\end{equation}
\]
- 当 \(n = k + 1\),由命题条件 \(\displaystyle\sum_{i=1}^{k+1} \lambda_{i} = 1\) 可得 \(\displaystyle 1-\lambda_{k+1} = \sum_{i=1}^{k}\lambda_{i}\)。\(\forall \lambda_{i} \gt 0\),所以 \(1- \lambda_{k+1} \neq 0\)
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right) &= f \left( \sum_{i=1}^{k} \lambda_{i} x_{i} + \lambda_{k+1}x_{k+1} \right) \\
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \dfrac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
\end{aligned}
\end{equation}
\]
考察 \(\displaystyle\frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\),只要其属于 \(I\),就可以直接使用下凸函数定义。\(x_{i}\) 是任意给定的,不妨设 \(x_{1} \lt x_{2} \lt \cdots x_{k} \lt x_{k+1}\)。所以有
\begin{aligned}
&\sum_{i=1}^{k} \lambda_{i} x_{1} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{k} \\
\implies & x_{1} \sum_{i=1}^{k} \lambda_{i} \leqslant \sum_{i=1}^{k} \lambda_{i} x_{i} \leqslant x_{k} \sum_{i=1}^{k} \lambda_{i} \\
\implies & x_{1} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i}}{1 - \lambda_{k+1}} \\
\implies & x_{1} \leqslant \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \leqslant x_{k}
\end{aligned}
\end{equation}
\]
由于 \(x_{1}\) 和 \(x_{k}\) 都属于 \(I\),则 \(\displaystyle \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}}\) 也属于 \(I\)。所以可以对 \(\eqref{eqn:one}\) 式使用下凸函数的定义
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&= f \left( \begin{split} \left( 1 - \lambda_{k+1} \right) \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} + \lambda_{k+1}x_{k+1} \end{split} \right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \begin{split} \frac{\displaystyle\sum_{i=1}^{k} \lambda_{i} x_{i}}{1 - \lambda_{k+1}} \end{split} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
\end{aligned}
\end{equation}
\]
由于 \(\displaystyle\sum_{i=1}^{k} \frac{\lambda_{i}}{1 - \lambda_{k+1}} = 1\),符合 \(n=k\) 时 Jensen 不等式成立条件,所以有 \(\displaystyle f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) \leqslant \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right)\),代入 \(\eqref{eqn:two}\) 式可以得到 Jensen 不等式成立
\begin{aligned}
f \left( \sum_{i=1}^{k+1} \lambda_{i} x_{i} \right)
&\leqslant \left( 1 - \lambda_{k+1} \right) f \left( \displaystyle\sum_{i=1}^{k} \frac{\lambda_{i} x_{i}}{1 - \lambda_{k+1}} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&\leqslant \left( 1 - \lambda_{k+1} \right) \sum_{i=1}^{k} \frac{\lambda_{i}}{1-\lambda_{k+1}} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k} \lambda_{i} f \left( x_{i} \right) + \lambda_{k+1} f \left(x_{k+1}\right) \\
&= \sum_{i=1}^{k+1} \lambda_{i} f \left( x_{i} \right)
\end{aligned}
\end{equation}
\]
- 综上所述,由数学归纳法得 \(\forall n \left( n = 1, 2, \cdots, k, k+1, \cdots \right)\) 有
f \left( \sum_{i=1}^{n} \lambda_{i} x_{i} \right) \leqslant \sum_{i=1}^{n} \lambda_{i}f(x_{i})
\end{equation}
\]
即 Jensen 不等式成立。
- 直接将 \(\displaystyle\lambda_{i} = \frac{1}{n}\) 代入 \(\eqref{eqn:final}\) 式,可得
\]
Jensen 不等式证明的更多相关文章
- 机器学习数学|微积分梯度jensen不等式
机器学习中的数学 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记 索引 微积分,梯度和Jensen不等式 Tay ...
- Jensen 不等式
若f(x)为区间I上的下凸(上凸)函数,则对于任意xi∈I和满足∑λi=1的λi>0(i=1,2,...,n),成立: \[f(\sum ^{n} _{i=1} \lambda _{i}x_{i ...
- 归并排序、jensen不等式、非线性、深度学习
前言 在此记录一些不太成熟的思考,希望对各位看官有所启发. 从题目可以看出来这篇文章的主题很杂,这篇文章中我主要讨论的是深度学习为什么要"深"这个问题.先给出结论吧:"深 ...
- 数学分析中jensen不等式由浅入深进行教学(转)
中国知网:数学分析中Jensen不等式由浅入深进行教学
- 【数学基础篇】---详解极限与微分学与Jensen 不等式
一.前述 数学基础知识对机器学习还有深度学习的知识点理解尤为重要,本节主要讲解极限等相关知识. 二.极限 1.例子 当 x 趋于 0 的时候,sin(x) 与 tan(x) 都趋于 0. 但是哪一个趋 ...
- 从Jensen不等式到Minkowski不等式
整理即证 参考资料: [1].琴生不等式及其加权形式的证明.Balbooa.https://blog.csdn.net/balbooa/article/details/79357839.2018.2 ...
- schwarz( 施瓦兹)不等式证明
证明 如果: 函数 y=ax^2+2bx+c 对任意x >=0 时 y>=0; 函数图象在全部x轴上方,故二次方程判别式 b^2-4ac<=0;(即方程无实数解) 即(2b)^2&l ...
- 凸函数与Jensen不等式
这个是在凸优化里面看的,在EM算法中看有用到,所以用latex写了篇回忆用的小短文,现在不会把latex产生的pdf怎么转变成放到这里的内容. 所以我选择直接贴图. 这个pdf可以在我的资源里找到. ...
- MT【23】用算术几何不等式证明数列极限存在
评:如果不需要精确到3,上界的求法可以利用$$(1+\frac{1}{n})^n*\frac{1}{2}*\frac{1}{2}<(\frac{n+\frac{1}{n}*n+\frac{1}{ ...
- Jensen不等式
随机推荐
- vue-test ------class绑定
<template> <p :class="{'active':isActive}">Class样式绑定</p> <p :class=&q ...
- flask中使用pyjwt
**pyjwt使用教程: ** https://pyjwt.readthedocs.io/en/stable/ 使用案例 import datetime from flask import Flask ...
- Vue.js 原理分析
本文内容提炼于<Vue.js设计与实现>,全书共 501 页,对 Vue.js 的设计原理从 0 到 1,循序渐进的讲解. 篇幅比较长,需要花些时间慢慢阅读,在合适的位置会给出在线示例以供 ...
- 【OpenVINO】 使用 OpenVINO CSharp API 部署 PaddleOCR 项目介绍
前言: 在之前的项目中,我们已经使用 OpenVINOTM CSharp API 部署 PaddleOCR 全系列模型,但随着PaddleOCRv4版本发布以及OpenVINO CSharp AP ...
- nacos-config配置中心
依赖 <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-clou ...
- TextCNN和TextRNN:原理与实践
1.TextCNN原理 CNN的核心点在于可以捕获信息的局部相关性,具体到文本分类任务中可以利用CNN来提取句子中类似N-Gram的关键信息. (1)一维卷积:使用不同尺寸的kernel_size来模 ...
- 详解GaussDB(DWS)通信安全的小妙招:连接认证机制
本文分享自华为云社区<GaussDB(DWS)数据库安全系列之通信安全>,作者:yd_262982826. 1. 前言 适用版本:[8.1.3及以上] 网络是一个开放的环境,仅仅依靠用户名 ...
- JAVA已过气?中俄大佬对话告诉你俄罗斯最受欢迎的编程语言是什么!
摘要:中俄大佬对话:俄罗斯最受欢迎的编程语言是什么?Gitee如何抗住数据压力? 众所周知,Java作为一门非常成熟的语言,国内拥趸者众多,但随着后浪们的崛起,如今的Java在国际上是否还占据主流地位 ...
- 带你认识MindSpore量子机器学习库MindQuantum
摘要:MindSpore在3.28日正式开源了量子机器学习库MindQuantum,本文介绍MindQuantum的关键技术. 本文分享自华为云社区<MindSpore量子机器学习库MindQu ...
- Java注解(批注)的基本原理
为什么要使用注解? 早期版本的Spring是通过XML文件的形式对整个框架进行配置的,一个缩减版的配置文件如下 <?xml version="1.0" encoding=&q ...