机器学习之朴素贝叶斯&贝叶斯网络
- 贝叶斯决决策论
在所有相关概率都理想的情况下,贝叶斯决策论考虑基于这些概率和误判损失来选择最优标记,基本思想如下:
(1)已知先验概率和类条件概率密度(似然)
(2)利用贝叶斯转化为后验概率
(3)根据后验概率的大小进行决策分类
1、风险最小化
风险:根据后验概率可以获得将样本分为某类所产生的期望损失,即在该样本上的“条件风险”。

目的:寻找最小化总体风险,只需在每个样本上选择能使条件风险最小的类标记

2、决策风险最小化---后验概率最大化
获得后验概率有两种方法,机器学习也因为这两种方法被分为判别模型和生成模型。
判别模型:对于给定的x, 通过建模P(c|x)来预测c.
生成模型:先对联合分布P(c,x)建模,在算出P(c|x)

- 朴素贝叶斯(NB)
假设:属性之间需要相互独立
算法:
input: 训练集T={(xi,yi)|i=1...N}
output:实例x的分类

- 半朴素贝叶斯(SNB)
适当地考虑一些属性之间的相互依赖关系
问题变为:寻找被依赖的属性,即父属性。
SPODE:所有属性都依赖于同一属性,通过交叉验证的方法确定超父属性。

TAN(最大带权生成树):

(1)计算量属性之间的互信息,作为两节点之间边的权重

(2)插入最大权重边
(3)找到下一个最大边,并加入到树中,要求不成为环
(4)重复上述过程,直到插入n-1条边
(5)标出方向
AODE:
集成学习机制,更强大的独依赖分类器,尝试将每个属性作为超父来构建SPODE
- 贝叶斯网络(NB)
经典的概率图模型(有向无环图模型)
把某个研究系统中涉及的随机变量,根据能否条件独立的绘制在一张有向图中,就成了贝叶斯网络。一个贝叶斯网络由结构和参数两部分组成。
三个变量间的典型依赖关系:
(1)同父结构(tail-to-tail)

c已知的情况下,P(a,b,c)=P(a)P(b|c)P(b|c),无法得出a,b独立。
c未知的情况下,a,b独立
(2)V型结构(head-to-head)
c未知时,a,b独立
(3)顺序结构(head-to-tail)

c已知时,a,b独立;反之,不独立。
- 如何学习构成一个贝叶斯网络
根据训练集学习出好的贝叶斯网络是解决问题的关键,“评分搜索”是常用的学习方法。
爬山算法:
(1)选择一个网络结构G(一般为空)
(2)计算这一结构的得分,并取最大得分
(3)随着得分的增大,循环进行:对边的增加和修正,更新最大得分
(4)返回一个有向图。
- R语言代码实现:
朴素贝叶斯:

贝叶斯网络:


机器学习之朴素贝叶斯&贝叶斯网络的更多相关文章
- 说说C#之父——安德斯·海尔斯伯格
安德斯·海尔斯伯格(Anders Hejlsberg,1960.12~),丹麦人,Turbo Pascal编译器的主要作者,Delphi和.NET之父! 看到照片的那一刹那儿,我就觉得帅爆了,53岁的 ...
- [机器学习&数据挖掘]朴素贝叶斯数学原理
1.准备: (1)先验概率:根据以往经验和分析得到的概率,也就是通常的概率,在全概率公式中表现是“由因求果”的果 (2)后验概率:指在得到“结果”的信息后重新修正的概率,通常为条件概率(但条件概率不全 ...
- 机器学习:朴素贝叶斯--python
今天介绍机器学习中一种基于概率的常见的分类方法,朴素贝叶斯,之前介绍的KNN, decision tree 等方法是一种 hard decision,因为这些分类器的输出只有0 或者 1,朴素贝叶斯方 ...
- Python机器学习算法 — 朴素贝叶斯算法(Naive Bayes)
朴素贝叶斯算法 -- 简介 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法.最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Baye ...
- 100天搞定机器学习|Day15 朴素贝叶斯
Day15,开始学习朴素贝叶斯,先了解一下贝爷,以示敬意. 托马斯·贝叶斯 (Thomas Bayes),英国神学家.数学家.数理统计学家和哲学家,1702年出生于英国伦敦,做过神甫:1742年成为英 ...
- 吴裕雄--天生自然python机器学习:朴素贝叶斯算法
分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同 时给出这个猜测的概率估计值. 概率论是许多机器学习算法的基础 在计算 特征值取某个值的概率时涉及了一些概率知识,在那里我们先 ...
- 概率图形模型(PGM)学习笔记(四)-贝叶斯网络-伯努利贝叶斯-贝叶斯多项式
之前忘记强调重要的差异:链式法则的条件概率和贝叶斯网络的链式法则之间的差异 条件概率链式法则 P\left({D,I,G,S,L} \right) = P\left( D \right)P\left( ...
- 掌握Spark机器学习库-08.2-朴素贝叶斯算法
数据集 iris.data 数据集概览 代码 import org.apache.spark.SparkConf import org.apache.spark.ml.classification.{ ...
- Infer.net 开源组件: 1, 机器学习入门,要从贝叶斯说起
我的入门方式,先从应用现象中,总结规律反推本质.一头扎进理论书籍是不对的. 老外的先进,还是体现在传承方面.没办法,我们竞争压力大,有好东西藏着掖着.大家都苦逼 我最开始是从介绍,有了基本概念,见xx ...
随机推荐
- Visual Studio 2017/2019 企业版 Enterprise 激活码
VS2017 Enterprise: NJVYC-BMHX2-G77MM-4XJMR-6Q8QF VS2017 Professional: KBJFW-NXHK6-W4WJM-CRMQB-G3CDH ...
- 从Scratch到Python之角色与造型
从Scratch到Python之角色与造型 继续讲解通过python turtle从积木编程过渡到代码编程的技巧.角色是scratch中很重要的主角,每个角色可以更换不同的造型或者音效,堆叠不同的积木 ...
- Maven安装环境变量配置教程(带图)
Maven安装配置环境变量教程 什么是maven:Maven是一个软件项目管理和综合工具.基于项目对象模型(POM)的概念,Maven可以从一个中心资料片管理项目构建,报告和文件. (简单来说就是,安 ...
- js中的继承总结全( 含new 原理过程 )
1. 借用 new 构造函数继承 原理: 利用 new 的原理, 通过apply,call , bind 改变 this , 只能实现部分方法的继承: MDN对new的描述: new 运算符创建一个 ...
- SSM框架完成Ajax简单用户登录验证
一.前端JSP <%@ page contentType="text/html;charset=UTF-8" language="java" %> ...
- SpringBoot之Java配置
Java配置也是Spring4.0推荐的配置方式,完全可以取代XML的配置方式,也是SpringBoot推荐的方式. Java配置是通过@Configuation和@Bean来实现的: 1.@Conf ...
- JMM - Java内存模型
内存模型的作用是定义变量的访问规则.包含:实例字段.静态字段.构成数组对象的元素.不包括局部变量和方法参数等线程私有变量. JMM所有变量都在主存,每个线程都有自己的工作内存.线程的工作内存中保存了线 ...
- 跟我一步一步写出MongoDB Web 可视化工具(二)
前言 上篇讲了一些基础,主要注重的是查,包括建立数据库链接.获取数据库.获取表.列出数据库.列出表.列出索引.获取数据等. 本篇依然是基础,注重增改删,废话不多说,咱们开始. 进阶 创建一个数据库和一 ...
- Oracle扩展的统计信息
我们在收集列的统计信息与直方图时,往往都是对某一列的收集.当谓词使用多个相关列时,会导致约束条件的冗余.这几个相关的列也被称作关联列.出现这种情况时,查询优化器也会做出不准确的判断.所以我们必须对这些 ...
- C# 3.0 / C# 3.5 对象集合初始化器、匿名类
对象集合初始化器 在 .NET 2.0 中构造一个对象的方法一是提供一个重载的构造函数,二是用默认的构造函数生成一个对象,然后对其属性进行赋值. 在 .NET 3.5/C# 3.0 中,我们有一种更好 ...