熵、交叉熵、相对熵（KL 散度）意义及其关系

熵：H(p)=−∑xp(x)logp(x)
交叉熵：H(p,q)=−∑xp(x)logq(x)
相对熵：KL(p∥q)=−∑xp(x)logq(x)p(x)
- 相对熵（relative entropy）也叫 KL 散度（KL divergence）；
- 用来度量两分布之间的不相似性（dissimilarity）；

通过交叉熵的定义，连接三者：

H(p,q)===−∑xp(x)logq(x)−∑xp(x)logp(x)−∑xp(x)logq(x)p(x)H(p)+KL(p∥q)

1. 简森不等式与 KL散度

KL(p∥q)=−∫p(x)lnq(x)p(x)dx

因为 −lnx 是凸函数，所以满足，凸函数的简森不等式的性质：

f(E)≤E(f)

这里我们令 f(⋅)=−lnx，则其是关于 x 的凸函数，因此：

E(f())≥f(E)⇓−∫p(x)lnq(x)p(x)dx≥−ln∫q(x)dx=0

也即 KL 散度恒大于等于 0；

熵、交叉熵、相对熵（KL 散度）意义及其关系的更多相关文章

信息论相关概念：熵交叉熵 KL散度 JS散度
目录机器学习基础--信息论相关概念总结以及理解 1. 信息量(熵) 2. KL散度 3. 交叉熵 4. JS散度机器学习基础--信息论相关概念总结以及理解摘要: 熵(entropy).KL 散度 ...
信息熵，交叉熵与KL散度
一.信息熵若一个离散随机变量 $X$ 的可能取值为 $X = \{ x_{1}, x_{2},...,x_{n}\}$,且对应的概率为: \[p(x_{i}) = p(X=x_{i}) \] ...
深度学习中交叉熵和KL散度和最大似然估计之间的关系
机器学习的面试题中经常会被问到交叉熵(cross entropy)和最大似然估计(MLE)或者KL散度有什么关系,查了一些资料发现优化这3个东西其实是等价的. 熵和交叉熵提到交叉熵就需要了解下信息论 ...
损失函数--KL散度与交叉熵
损失函数在逻辑回归建立过程中,我们需要一个关于模型参数的可导函数,并且它能够以某种方式衡量模型的效果.这种函数称为损失函数(loss function). 损失函数越小,则模型的预测效果越优.所以我 ...
[ch03-02] 交叉熵损失函数
系列博客,原文在笔者所维护的github上:https://aka.ms/beginnerAI, 点击star加星不要吝啬,星越多笔者越努力. 3.2 交叉熵损失函数交叉熵(Cross Entrop ...
TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数,交叉熵
TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数,交叉熵神经元模型:用数学公式比表示为:f(Σi xi*wi + b), f为激活函数神经网络是以神经元为基本单位构成的激 ...
经典损失函数：交叉熵（附tensorflow）
每次都是看了就忘,看了就忘,从今天开始,细节开始,推一遍交叉熵. 我的第一篇CSDN,献给你们(有错欢迎指出啊). 一.什么是交叉熵交叉熵是一个信息论中的概念,它原来是用来估算平均编码长度的.给定两 ...
【深度学习】K-L 散度，JS散度，Wasserstein距离
度量两个分布之间的差异 (一)K-L 散度 K-L 散度在信息系统中称为相对熵,可以用来量化两种概率分布 P 和 Q 之间的差异,它是非对称性的度量.在概率学和统计学上,我们经常会使用一种更简单的.近 ...
ELBO 与 KL散度
浅谈KL散度一.第一种理解相对熵(relative entropy)又称为KL散度(Kullback–Leibler divergence,简称KLD),信息散度(information dive ...
从香农熵到手推KL散度
信息论与信息熵是 AI 或机器学习中非常重要的概念,我们经常需要使用它的关键思想来描述概率分布或者量化概率分布之间的相似性.在本文中,我们从最基本的自信息和信息熵到交叉熵讨论了信息论的基础,再由最大似 ...

随机推荐

ARM+linux学习过程（2）安装vmware-tool过程与错误解决
安装: 点击Ubuntu VMware菜单的-VM-Install VMware Tools 这时,在Ubuntu下会自动加载Linux版的VMware Tools的安装光盘镜像.你会看到虚拟机的桌面 ...
【Codeforces Round #439 (Div. 2) C】The Intriguing Obsession
[链接] 链接 [题意] 给你3种颜色的点. 每种颜色分别a,b,c个. 现在让你在这些点之间加边. 使得,同种颜色的点之间,要么不连通,要么连通,且最短路至少为3 边是无向边. 让你输出方案数 [题 ...
OpenGL_ES-纹理
OpenGL_ES2.0 -纹理一:纹理基础: 1: 纹素的概念: 一个二维纹理在OpenGLES2.0中是非经常见的,二维纹理就是一个二维数组,每一个数据元素称为纹素,详细格式例如以下: GL_R ...
Spring+Netty+WebSocket实例
比较贴近生产,详见注释一.pom.xml 具体太长,详见源码 </dependency> <dependency> <groupId>io.netty</g ...
Vue.js开发环境搭建的介绍
包含了最基础的Vue.js的框架,包含了打包工具和测试工具,开发调试的最基本的服务器,不需要关注细节,只需关注Vuejs对项目的实现 npm在国内的网络使用较慢,所以推荐下载安装淘宝的镜像 1: 2: ...
【record】9.24..10.1
因为参加比赛所以做得比较少了
Android 应用中十大常见 UX 错误分类： H1_ANDROID 2013-09-21 13:59 404人阅读评论(0) 收藏
转载自:http://www.apkbus.com/android-5661-1.html 摘要: Android 开发者关系团队每天都会试用无数的 App 或者受到无数的开发者发来的请求评测的 Ap ...
[NPM] Run npm scripts when files change with onchange
In this lesson we will look at how we can setup our npm scripts to execute when the file system has ...
php如何实现万年历的开发（每日一课真是非常有效率）
php如何实现万年历的开发(每日一课真是非常有效率) 一.总结一句话总结: 1.判断每月有多少天: 通过data函数来判断,$days=date('t',$firstday); 2.判断每月的第一天 ...
STS开发环境搭建与配置
STS开发环境搭建与配置 (2012-04-11 07:24:51) 转载▼ 1. 环境准备安装JDK.MAVEN 1.1. 下载下载sprdfingsource-tool-su ...

熵、交叉熵、相对熵（KL 散度）意义及其关系

1. 简森不等式与 KL散度

熵、交叉熵、相对熵（KL 散度）意义及其关系的更多相关文章

随机推荐

热门专题