Accord.NET_Naive Bayes Classifier

我们这个系列主要为了了解并会使用Accord.NET中机器学习有关算法，因此主要关注的是算法针对的的问题，算法的使用。所以主要以代码为主，通过代码来学习，在脑海中形成一个轮廓。下面就言归正传，开始贝叶斯分类器的学习。

朴素贝叶斯分类器，一个基于贝叶斯理论的简单概率分类器。简单的说，贝叶斯理论是独立特征模型，也就是说一个类别的指定特征的表现与否，跟其他任何特征无关。

TestCase1

著名的打网球实验(Tom Mitchell (1998))。实验中，基于四个条件，推测某人是否想去打网球。这些条件变量都是可分类的，即各变量的可取值之间没有关系

首先需要将问题的表现形式简化。通过Accord.Statistics.Filters.Codification，将问题转为用数字表示的codebook，比如Sunny转为0，Overcast为1，Rain为2。以此类推，得到训练用的输入输出。

接下来应该训练贝叶斯模型，用来预测最后一列，是否打网球。这里使用“Outlook”，“Temperature”，“Humidity”，“Wind”作为条件，预测是否打网球，四个输入一个输出。由于输入条件都是可分类的，在创建贝叶斯模型时应该指定每个变量的取值有几种可能，如果训练集的输入已经覆盖了每个变量的所有的情况，可以不创建模型，本例就是如此，因为算法的Learn函数会检查模型是否为空，空的情况下会根据输入输出创建。

得到分类器后，使用Decide方法根据输入计算输出。

接下来看代码

public void ComputeTest()

{

    #region doc_mitchell

    DataTable data = new DataTable("Mitchell's Tennis Example");

    data.Columns.Add("Day", "Outlook", "Temperature", "Humidity", "Wind", "PlayTennis");

    data.Rows.Add("D1", "Sunny", "Hot", "High", "Weak", "No");

    data.Rows.Add("D2", "Sunny", "Hot", "High", "Strong", "No");

    data.Rows.Add("D3", "Overcast", "Hot", "High", "Weak", "Yes");

    data.Rows.Add("D4", "Rain", "Mild", "High", "Weak", "Yes");

    data.Rows.Add("D5", "Rain", "Cool", "Normal", "Weak", "Yes");

    data.Rows.Add("D6", "Rain", "Cool", "Normal", "Strong", "No");

    data.Rows.Add("D7", "Overcast", "Cool", "Normal", "Strong", "Yes");

    data.Rows.Add("D8", "Sunny", "Mild", "High", "Weak", "No");

    data.Rows.Add("D9", "Sunny", "Cool", "Normal", "Weak", "Yes");

    data.Rows.Add("D10", "Rain", "Mild", "Normal", "Weak", "Yes");

    data.Rows.Add("D11", "Sunny", "Mild", "Normal", "Strong", "Yes");

    data.Rows.Add("D12", "Overcast", "Mild", "High", "Strong", "Yes");

    data.Rows.Add("D13", "Overcast", "Hot", "Normal", "Weak", "Yes");

    data.Rows.Add("D14", "Rain", "Mild", "High", "Strong", "No");

    #endregion

    #region doc_codebook

    // 创建codification codebook

    // 把字符串变量转为独立的符号变量

    Codification codebook = new Codification(data,

        "Outlook", "Temperature", "Humidity", "Wind", "PlayTennis");

    // 提取出输入输出对作为训练集

    DataTable symbols = codebook.Apply(data);

    int[][] inputs = symbols.ToArray<int>("Outlook", "Temperature", "Humidity", "Wind");

    int[] outputs = symbols.ToArray<int>("PlayTennis");

    #endregion

    #region doc_learn

    // 创建一个贝叶斯算法实例

    var learner = new NaiveBayesLearning();

    // 用训练集学习一个贝叶斯模型

    NaiveBayes nb = learner.Learn(inputs, outputs);

    #endregion

    #region doc_test

    // 测试一组数据，在sunny，cool，humid，windy的条件下，某人是否会打网球

    // 先将条件通过codebook编码为符号

    int[] instance = codebook.Translate("Sunny", "Cool", "High", "Strong");

    // 获得数字输出表示的答案

    int c = nb.Decide(instance); // answer will be 0

    // 将数字输出的答案通过codebook转为实际的"Yes"/"No"

    string result = codebook.Translate("PlayTennis", c); // 答案是"No"

    // 还可以提取每种答案的概率

    double[] probs = nb.Probabilities(instance); // { 0.795, 0.205 }

    #endregion

    Assert.AreEqual("No", result);

    Assert.AreEqual(, c);

    Assert.AreEqual(0.795, probs[], 1e-);

    Assert.AreEqual(0.205, probs[], 1e-);

    Assert.AreEqual(, probs.Sum(), 1e-);

    Assert.IsFalse(double.IsNaN(probs[]));

    Assert.AreEqual(, probs.Length);

}

TestCase2

下面的例子针对离散模型设置了更具体的学习参数。

public void laplace_smoothing_missing_sample()

{

    #region doc_laplace

    // Laplace rule针对当某个输入符号的某个类别不在训练集中时

    // 比如本例中输入的第二列应包含0，1，2三个值

    // 但实际的例子中只有1，2两种情况

    int[][] inputs =

    {

        //      输入         输出

        new [] { ,  }, //  0

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

        new [] { ,  }, //

    };

    int[] outputs = // 对应的分类

    {

        , , , , , , , , ,

    };

    // 由于训练集没有覆盖实际期望的所有情况Since the data is not enough to determine which symbols we are

    // 所以需要指定贝叶斯模型

    // 第一个输入有两种情况，第二个输入有三种情况

    var bayes = new NaiveBayes(classes: , symbols: new[] { ,  });

    // 创建学习算法时指定模型

    var learning = new NaiveBayesLearning()

    {

        Model = bayes

    };

    // 使用Laplace rule

    learning.Options.InnerOption.UseLaplaceRule = true;

    // 训练贝叶斯模型

    learning.Learn(inputs, outputs);

    // 第二个输入为0来预测分类结果

    int answer = bayes.Decide(new int[] { ,  });

    #endregion

    Assert.AreEqual(, answer);

    double prob = bayes.Probability(new int[] { ,  }, out answer);

    Assert.AreEqual(, answer);

    //Assert.AreEqual(0.52173913043478259, prob, 1e-10);

    Assert.AreEqual(0.44444444444444453, prob, 1e-);

    double error = new ZeroOneLoss(outputs)

    {

        Mean = true

    }.Loss(bayes.Decide(inputs));

    Assert.AreEqual( / 9.0, error);

}

TestCase3

下面的例子创建了一个多类别的分类器，使用整数输入并创建离散的贝叶斯模型。

public void ComputeTest3()

{

    #region doc_multiclass

    // 将下列数据分成三类//

    int[][] inputs =

    {

        //               输入         输出

        new int[] { , , ,  }, //  0

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

        new int[] { , , ,  }, //

    };

    int[] outputs = // 对应的输出类别

    {

        , , , , ,

        , , , , ,

        , , , , ,

    };

    // 创建算法

    var learner = new NaiveBayesLearning();

    // 训练模型

    NaiveBayes nb = learner.Learn(inputs, outputs);

    // 使用第一个样本测试

    int answer = nb.Decide(new int[] { , , ,  }); // should be 1

    #endregion

    double error = new ZeroOneLoss(outputs).Loss(nb.Decide(inputs));

    Assert.AreEqual(, error);

    for (int i = ; i < inputs.Length; i++)

    {

        error = nb.Compute(inputs[i]);

        double expected = outputs[i];

        Assert.AreEqual(expected, error);

    }

}

TestCase4

下面的例子使用了高斯模型，并且展示如何设置更加具体的学习参数。

public void learn_test()

{

    #region doc_learn

    // 将下面的输入分成三类    double[][] inputs =

    {

        //               输入           输出

        new double[] { , , ,  }, //  0

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

        new double[] { , , ,  }, //

    };

    int[] outputs = // 对应输出的类别

    {

        , , , , ,

        , , , , ,

        , , , , ,

    };

    // 高斯模型

    var teacher = new NaiveBayesLearning<NormalDistribution>();

    // component distributions

    teacher.Options.InnerOption = new NormalOptions

    {

        Regularization = 1e- // 避免0变异

    };

    // 训练模型

    NaiveBayes<NormalDistribution> bayes = teacher.Learn(inputs, outputs);

    // 预测输出

    int[] predicted = bayes.Decide(inputs);

    // 预估模型误差，应为0

    double error = new ZeroOneLoss(outputs).Loss(predicted);

    // 预测指定输入

    int answer = bayes.Decide(new double[] { , , ,  }); // 应为1

    #endregion

    Assert.AreEqual(, error);

    Assert.AreEqual(, answer);

    Assert.IsTrue(predicted.IsEqual(outputs));

}

Accord.NET_Naive Bayes Classifier的更多相关文章

学习笔记之Naive Bayes Classifier
Naive Bayes classifier - Wikipedia https://en.wikipedia.org/wiki/Naive_Bayes_classifier In machine l ...
朴素贝叶斯分类器的应用 Naive Bayes classifier
一.病人分类的例子让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难. 某个医院早上收了六个门诊病人,如下表. 症状职业疾病打喷嚏护士感冒打喷嚏农夫过敏头痛建筑工 ...
机器学习算法 --- Naive Bayes classifier
一.引言在开始算法介绍之前,让我们先来思考一个问题,假设今天你准备出去登山,但起床后发现今天早晨的天气是多云,那么你今天是否应该选择出去呢? 你有最近这一个月的天气情况数据如下,请做出判断. 这个月 ...
机器学习---朴素贝叶斯分类器（Machine Learning Naive Bayes Classifier）
朴素贝叶斯分类器是一组简单快速的分类算法.网上已经有很多文章介绍,比如这篇写得比较好:https://blog.csdn.net/sinat_36246371/article/details/6014 ...
PGM学习之三朴素贝叶斯分类器（Naive Bayes Classifier）
介绍朴素贝叶斯分类器的文章已经很多了.本文的目的是通过基本概念和微小实例的复述,巩固对于朴素贝叶斯分类器的理解. 一朴素贝叶斯分类器基础回顾朴素贝叶斯分类器基于贝叶斯定义,特别适用于输入数据维数较 ...
Naive Bayes Classifier 朴素贝叶斯分类器
贝叶斯分类器的分类根据实际处理的数据类型, 可以分为离散型贝叶斯分类器和连续型贝叶斯分类器, 这两种类型的分类器, 使用的计算方式是不一样的. 贝叶斯公式首先看一下贝叶斯公式 $ P\left ( ...
naive bayes classifier in data mining
https://www-users.cs.umn.edu/~kumar001/dmbook/slides/chap4_naive_bayes.pdf -- textbook https://www. ...
OpenCV Machine Learning 之正态贝叶斯分类器（Normal Bayes Classifier）
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/zhjm07054115/article/details/27631913
[Machine Learning & Algorithm] 朴素贝叶斯算法（Naive Bayes）
生活中很多场合需要用到分类,比如新闻分类.病人分类等等. 本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法. 一.病人分类的例子让我从一个例子 ...

随机推荐

[转]html转码表
为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希 ...
php 中的closure用法
Closure,匿名函数,是php5.3的时候引入的,又称为Anonymous functions.字面意思也就是没有定义名字的函数.比如以下代码(文件名是do.php) <?php funct ...
Redis数据类型之List（三）
前言:list即链表,它是一个能维持数据先后顺序的列表,便于在表的两端追加和删除数据,中间位置的存取具有O(N)的时间复杂度,是一个双向链表. 一.内部原理 redis ...
Vue2 全家桶仿微信App 项目，支持多人在线聊天和机器人聊天
前言这个项目是利用工作之余写的一个模仿微信app的单页面应用,整个项目包含27个页面,涉及实时群聊,机器人聊天,同学录,朋友圈等等,后续页面还是开发中.写这个项目主要目的是练习和熟悉vue和vuex ...
[原创]Floodlight+ovs的基本使用
一.配置好openflow交换机配置好交换机的管理地址,可先用串口登,使管理口地址与controller地址在同一个网络中. 在交换机上配置controller地址: 如: 先用命令新建一个brid ...
javascript事件委托机制详解
以个人前端工作面试经历来看,javascript事件委托是问的最多的一类题目之一,熟悉事件委托能够了解你对于javascript的掌握程度. 面试官可能问一下问题,现在有5个li待办事件,需要实现当点 ...
WPF: 实现 ScrollViewer 滚动到指定控件处
在前端 UI 开发中,有时,我们会遇到这样的需求:在一个 ScrollViewer 中有很多内容,而我们需要实现在执行某个操作后能够定位到其中指定的控件处:这很像在 HTML 页面中点击一个链接后定位 ...
Sql_Case_When用法
http://wenku.baidu.com/link?url=XBnkUzGtiJFhTnQk5HbmdgndhVEYJdcfDEhSEIFeTRn9-41KMLf_49wKiydNCF-4g3Qi ...
[leetcode-553-Optimal Division]
Given a list of positive integers, the adjacent integers will perform the float division. For exampl ...
11.page，pagcontext，config对象

Accord.NET_Naive Bayes Classifier

Accord.NET_Naive Bayes Classifier的更多相关文章

随机推荐

热门专题