paper 113:Bhattacharyya distance
在统计理论中,Bhattacharyya距离用来度量两个离散或连续概率分布的相似性。它与Bhattacharyya系数(Bhattacharyya coefficient)高度相关,后者是用来度量两个统计样本的重叠度的。所有这些命名都是为了纪念A. Bhattacharyya,一个在1930年工作于印度统计局的统计学家。该系数可以用来度量两个样本集的相似性。它通常在分类问题中被用来判断类别的可分性。
目录
·定义
·Bhattacharyya系数
定义
对于定义在同一个定义域X上的两个离散概率分布p和q来说,它们之间的Bhattacharyya距离可定义如下:

这里

被称为Bhattacharyya系数。
对于连续概率分布,Bhattacharyya系数可以定义如下:

在以上两种情况下,0<=BC<=1并且0<=DB<=∞。DB并不遵循三角不等式,但是Hellinger距离满足三角不等式。
对于一个多维高斯分布来说pi=N(mi,Pi),

这里mi和Pi分别代表该分布的均值和方差,并且

注意到,在这种情况下Bhattacharyya距离的第一项类似于Mahalanobis距离(马氏距离)。
Bhattacharyya系数
Bhattacharyya系数用来度量两个统计样本的重叠度。该系数可以用来度量两个样本集的可分性。
计算Bhattacharyya系数包含了一个基本的关于两个样本集重合度的积分运算。两个样本集中的定义域被分成了事前定义的几份,这种划分可以体现在下面的定义中:

其中a,b代表样本,n代表划分的数目,∑ai和∑bi分别代表两个样本集中在第i个划分中的样本之和。
对于两个样本集来说,如果相同划分中的样本数越多,样本和越大,则该式的值越大。划分数的选择取决于每一个样本集中的样本数:太少的划分将因为过高估计了重叠区域而减小精度,而太多的划分将会因为在本该有重叠的区域没有恰好重叠而减小精度(最精细的划分将会使每一个相同的区间中都没有重叠)。
如果在每一个划分区间内的乘积都为零,则Bhattacharyya系数也为零。这就意味着如果A和B两个样本集都与样本集C完全可分,则BC(A,C)=B(B,C)=0,即Bhattacharyya系数对于A和B无法区分。
上述内容来自wikipedia
http://en.wikipedia.org/wiki/Bhattacharyya_distance
paper 113:Bhattacharyya distance的更多相关文章
- paper 114:Mahalanobis Distance(马氏距离)
(from:http://en.wikipedia.org/wiki/Mahalanobis_distance) Mahalanobis distance In statistics, Mahalan ...
- paper 112:hellinger distance
在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度.它是f散度的一种(f散度——度量两个概率分布相似度的指标).Hellinger距离被定义成Hellinger积分的形式,这种 ...
- paper 156:专家主页汇总-计算机视觉-computer vision
持续更新ing~ all *.files come from the author:http://www.cnblogs.com/findumars/p/5009003.html 1 牛人Homepa ...
- paper 141:some paper with ComputerCV、MachineLearning[转]
copy from:http://blog.csdn.net/zouxy09/article/details/8550952 一.特征提取Feature Extraction: · S ...
- paper 97:异质人脸识别进展的资讯
高新波教授团队异质人脸图像识别研究取得新突破,有望大大降低刑侦过程人力耗费并提高办案效率 近日,西安电子科技大学高新波教授带领的研究团队,在异质人脸图像识别研究领域取得重要进展,其对香 ...
- paper 94:视觉领域博客资源1之中国部分
这是收录的图像视觉领域的博客资源的第一部分,包含:中国内地.香港.台湾 这些名人大家一般都熟悉,本文仅收录了包含较多资料的个人博客,并且有不少更新,还有些名人由于分享的paper.code或者数据集不 ...
- paper 92:图像视觉博客资源2之MIT斯坦福CMU
收录的图像视觉(也包含机器学习等)领域的博客资源的第二部分,包含:美国MIT.斯坦福.CMU三所高校 1)这些名人大家一般都熟悉,本文仅收录了包含较多资料的个人博客,并且有不少更新,还有些名人由于分享 ...
- paper 91:边缘检测近期最新进展的讨论
VALSE QQ群对边缘检测近期最新进展的讨论,内容整理如下: 1)推荐一篇deep learning的文章,该文章大幅度提高了edge detection的精度,在bsds上,将edge detec ...
- paper 86:行人检测资源(上)综述文献【转载,以后使用】
行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智能机器人等领域.从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,主要还是在性能和速度方面还不能达到一个 ...
随机推荐
- codeforces589J 简单dfs,队列
J. Cleaner Robot time limit per test 2 seconds memory limit per test 512 megabytes input standard in ...
- html5 可以讓使用者輸入url網址 ,去play影片
<html> <head> <title>Simple Video Example</title> <script> function pl ...
- Secrets
https://www.youtube.com/watch?v=qHm9MG9xw1o I need another storySomething to get off my chestMy life ...
- VS2010 F5调试时出现:“ 尝试运行项目时出错:未捕获通过反射调用的方法引发的异常”解决
VS2010 F5调试时出现 尝试运行项目时出错:未捕获通过反射调用的方法引发的异常 两个解决方法:1) 打开项目属性,选择调试选项卡,将“启用非托管代码调试”一项钩上.2) 打开项目属性,选择调试选 ...
- uva 1382 - Distant Galaxy
题目连接:http://acm.hust.edu.cn/vjudge/contest/view.action?cid=91208#problem/G 题意: 给出平面上的n个点,找出一个矩形,使得边 ...
- android-时间选择器和日期选择器
一.实现动态输入日期和时间 * DataPicker(日历选择器) * DataPicker对象以init()方法指定DatePicker初始的年月日及OnDateChangedListener事件 ...
- crontab的坑
1. 命令 全路径 (eg:which mysql) 2.执行脚本 (脚本中加上#!/bin/bash) eg: /bin/bash script.sh 3. 输出信息(>>) 使用全 ...
- FZU1894 单调队列
S - 1019 Time Limit:1500MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Submit Sta ...
- echarts一个页面动态加载两张不同图表数据
参考 http://www.stepday.com/topic/?877 http://blog.csdn.net/for_china2012/article/details/45167161 // ...
- 【转】CSRF攻击的应对之道
CSRF 背景与介绍CSRF(Cross Site Request Forgery, 跨站域请求伪造)是一种网络的攻击方式,它在 2007 年曾被列为互联网 20 大安全隐患之一.其他安全隐患,比如 ...