ML—朴素贝叶斯

华电北风吹

日期：2015/12/12

朴素贝叶斯算法和高斯判别分析一样同属于生成模型。但朴素贝叶斯算法须要特征条件独立性如果，即样本各个特征之间相互独立。

一、朴素贝叶斯模型

朴素贝叶斯算法通过训练数据集学习联合概率分布p(x,y),其中x=(x1,x2,...,xn)∈Rn,y∈R。详细的对于K分类问题就是须要学习一个类别的先验概率分布p(y=ck),k=1,2,...,K和每一个类别下的条件概率分布(如式1-1)

p(x|y)=p(x1,x2,...,xn|y)(1-1)

因为朴素贝叶斯算法没有如果特征的分布，因此须要将每一个特征量化为离散型变量，然后学习各个特征水平下的条件概率。

如果各个特征xi被分别量化为Si个水平，那么共同拥有K+K∏ni=1Si个须要学习的參数。

可是，为了使朴素贝叶斯算法变得简单点—主要是降低參数个数，就强加了一个条件概率分布的独立性如果(详细如式1-2)

p(x|y)=p(x1,x2,...,xn|y)=∏ni=1P(xi|y)(1-2)

这样须要学习的參数个数就变为K+K∑ni=1Si个，大大的简化了模型。

二、朴素贝叶斯參数预计

在条件独立性如果下，贝叶斯模型的參数学习就简化为类别先验概率p(y=ck)和条件概率p(xi|y)的学习。

1、极大似然预计

对于训练数据集(x(i),y(i)),x(i)∈Rn,y(i)∈R，似然函数例如以下,

L(ϕy,ϕx|y)=∏mi=1p(x(i),y(i))=∏mi=1p(y(i))∏nj=1p(x(i)j|y(i))(2-1)

结合∑yϕy=1以及∑Sip(xi|y)=1,能够easy得到下式(简单的求偏导就可以，两式均是)：

ϕy=k=∑mi=11{y(i)=k}m(2-2)

ϕxi=j|y=k=∑mi=11{y(i)=k⋂xi=j}∑mi=11{y(i)=k}(2-3)

2、古德-图灵预计

主要用于解决统计样本不足的概率预计问题，主要思想是在统计中相信可靠的统计数据，而对不可信的统计数据打折扣的一种概率预计方法。同一时候将折扣出来的那一小部分概率给予为看见的事件。

3、贝叶斯预计(拉普拉斯光滑)

在公式2-2和2-3中。会出现分子分母同为0的情况。解决这样的情况的方案例如以下：

ϕy=k=∑mi=11{y(i)=k}+λm+Kλ(2-4)

ϕxi=j|y=k=∑mi=11{y(i)=k⋂xi=j}+λ∑mi=11{y(i)=k}+Sjλ(2-5)

当中λ≥0.一般取λ=1。

三、朴素贝叶斯决策方法—最大后验概率

对于測试数据x∈Rn，朴素贝叶斯模型採用贝叶斯规则决策。详细表述例如以下：

p(y|x)=argmaxkp(y=k)p(x|y=k)

採用后验概率最大的类别作为模型输出类别。

如今细致想想感觉朴素贝叶斯跟k-means逻辑上的思路还是比較接近的。

ML—朴素贝叶斯的更多相关文章

[置顶] 生成学习算法、高斯判别分析、朴素贝叶斯、Laplace平滑——斯坦福ML公开课笔记5
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9285001 该系列笔记1-5pdf下载请猛击这里. 本篇博客为斯坦福ML公开 ...
[ML学习笔记] 朴素贝叶斯算法（Naive Bayesian)
[ML学习笔记] 朴素贝叶斯算法(Naive Bayesian) 贝叶斯公式 \[P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)}\] 我们把P(A)称为"先 ...
朴素贝叶斯算法源码分析及代码实战【python sklearn/spark ML】
一.简介贝叶斯定理是关于随机事件A和事件B的条件概率的一个定理.通常在事件A发生的前提下事件B发生的概率,与在事件B发生的前提下事件A发生的概率是不一致的.然而,这两者之间有确定的关系,贝叶斯定理就 ...
贝叶斯、朴素贝叶斯及调用spark官网 mllib NavieBayes示例
贝叶斯法则机器学习的任务:在给定训练数据A时,确定假设空间B中的最佳假设. 最佳假设:一种方法是把它定义为在给定数据A以及B中不同假设的先验概率的有关知识下的最可能假设贝叶斯理论提供了 ...
【十大算法实现之naive bayes】朴素贝叶斯算法之文本分类算法的理解与实现
关于bayes的基础知识,请参考: 基于朴素贝叶斯分类器的文本聚类算法 (上) http://www.cnblogs.com/phinecos/archive/2008/10/21/1315948.h ...
朴素贝叶斯算法原理及Spark MLlib实例(Scala/Java/Python)
朴素贝叶斯算法介绍: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法. 朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,在没有其它可用信息下,我 ...
3.朴素贝叶斯和KNN算法的推导和python实现
前面一个博客我们用Scikit-Learn实现了中文文本分类的全过程,这篇博客,着重分析项目最核心的部分分类算法:朴素贝叶斯算法以及KNN算法的基本原理和简单python实现. 3.1 贝叶斯公式的推 ...
100天搞定机器学习|Day15 朴素贝叶斯
Day15,开始学习朴素贝叶斯,先了解一下贝爷,以示敬意. 托马斯·贝叶斯 (Thomas Bayes),英国神学家.数学家.数理统计学家和哲学家,1702年出生于英国伦敦,做过神甫:1742年成为英 ...
机器学习---用python实现朴素贝叶斯算法（Machine Learning Naive Bayes Algorithm Application）
在<机器学习---朴素贝叶斯分类器(Machine Learning Naive Bayes Classifier)>一文中,我们介绍了朴素贝叶斯分类器的原理.现在,让我们来实践一下. 在 ...

随机推荐

bzoj 3240 矩阵乘法+十进制快速幂
首先,构造出从f[][i]->f[][i+1]的转移矩阵a,和从f[i][m]->f[i+1][1]的转移矩阵b, 那么从f[1][1]转移到f[n][m]就是init*(a^(m-1)* ...
Java的Spi机制心得
Java spi : 是Java EE 给服务供应商提供的接口,供应商遵循接口契约提供自己的实现.. 简单来讲就是为某个接口寻找服务实现的机制. 在看JDBC源码当看到DriverManage.get ...
git中如何合并某个指定文件？
分支A_bracn和B_branch,只想将A_branch分支的某个文件f.txt合并到B_branch分支上.git checkout A_branch git checkout --p ...
WINDOWS 的 MKLINK : 硬链接，符号链接 : 文件符号链接, 目录符号链接 : 目录联接
玩转WIN7的MKLINK 引言: 换了新电脑,终于再次使用上啦WIN7 ,经过一个周每天重装N次系统,... ... ... ... 在xp系统下,junction命令要用微软开发的小程序 junc ...
SCSI Pass-Through Interface Tool
http://code.msdn.microsoft.com/SCSI-Pass-Through-a906ceef/sourcecode?fileId=59048&pathId=1919073 ...
PHP-系统流程
我们来系统的了解下ThinkPHP框架开发的应用的标准执行流程: 用户URL请求调用应用入口文件(通常是网站的index.php) 载入框架入口文件(ThinkPHP.php) 记录初始运行时间和内 ...
舌尖上的硬件：CPU/GPU芯片制造解析(高清)(组图)
一沙一世界,一树一菩提,我们这个世界的深邃全部蕴藏于一个个普通的平凡当中.小小的厨房所容纳的不仅仅是人们对味道的情感,更有推动整个世界前进的动力.要想理解我们的世界,有的时候只需要细细品味一下我们所喜 ...
nyoj 164&&poj2084 Game of Connections 【卡特兰】
题意:将1~2n个数依照顺时针排列好.用一条线将两个数字连接起来要求:线之间不能有交点.同一个点仅仅同意被连一次. 最后问给出一个n,有多少种方式满足条件. 分析: ans[n]表示n的中的种类数. ...
Bootstrap 3之美01-下载并引入页面
本篇主要包括: ■ 下载Bootstrap 3■ Bootstrap 3引入页面下载Bootstrap 3 →打开网站:http://getbootstrap.com/→点击屏幕中央位置的Down ...
去除ArcMap连接空间数据库中多余的属性表
这个操作目前可能不具有可行性,但是为了完整性还是在下面讲一下吧.如有兴趣的小伙伴,可以按照下面的操作方式去尝试. 一.需求去除ArcMap连接空间数据库中多余的属性表. PL/SQL中查询得到的内容 ...

ML—朴素贝叶斯

ML—朴素贝叶斯的更多相关文章

随机推荐

热门专题