感知机算法（PLA）代码实现

1. 引言
2. 载入库和数据处理
3. 感知机的原始形式
4. 感知机的对偶形式
5. 多分类情况—one vs. rest
6. 多分类情况—one vs. one
7. sklearn实现
8. 感知机算法的作图

1. 引言

在这里主要实现感知机算法（PLA）的以下几种情况：

PLA算法的原始形式（二分类）
PLA算法的对偶形式（二分类）
PLA算法的作图（二维）
PLA算法的多分类情况（包括one vs. rest 和one vs. one 两种情况）
PLA算法的sklearn实现

为了方便起见，使用鸢尾花数据集进行PLA算法的验证。

2. 载入库和数据处理

# 载入库

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

from sklearn.linear_model import Perceptron

import warnings

warnings.filterwarnings("ignore")

# 设置图形尺寸

plt.rcParams["figure.figsize"] = [14, 7]

plt.rcParams["font.size"] = 14

# 载入鸢尾花数据集

iris_data = load_iris()

xdata = iris_data["data"]

ydata = iris_data["target"]

3. 感知机的原始形式

感知机的详细原理见我的前一篇博客

class model_perceptron(object):

    """

    功能：实现感知机算法

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认为0.001

    参数 iter_epoch：迭代轮数，默认最大为1000

    """

    def __init__(self, w = None, b = 0, alpha = 0.001, max_iter_epoch = 1000):

        self.w = w

        self.b = b

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(X, self.w) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 按训练集的输入维度初始化w

        self.w = np.zeros(X.shape[1])

        # 误分类的样本就为True

        state = np.sign(self.linear_model(X)) != y

        # 迭代轮数

        total_iter_epoch = 1

        while state.any() and (total_iter_epoch <= self.max_iter_epoch):

            # 使用误分类点进行权重更新

            self.w += self.alpha * y[state][0] * X[state][0]

            self.b += self.alpha * y[state][0]

            # 状态更新

            total_iter_epoch += 1

            state = np.sign(self.linear_model(X)) != y

        print(f"fit model_perceptron(alpha = {self.alpha}, max_iter_epoch = {self.max_iter_epoch}, total_iter_epoch = {min(self.max_iter_epoch, total_iter_epoch)})")

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        return np.sign(self.linear_model(X)) 

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_predict = self.predict(X)

        y_score = (y_predict == y).sum() / len(y)

        return y_score

# 二分类的情况（原始形式）/ 数据集的处理与划分

X = xdata[ydata < 2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 原始形式的验证

ppn = model_perceptron()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

4. 感知机的对偶形式

class perceptron_dual(object):

    """

    功能：实现感知机的对偶形式

    参数 beta：每个实例点更新的次数组成的向量

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.beta = None

        self.w = None

        self.b = 0

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def fit(self, X, y):

        # 实例点的数量

        xnum = X.shape[0]

        # 初始化

        self.beta = np.zeros(xnum)

        # gram矩阵

        gram = np.dot(X, X.T)

        # 迭代条件

        state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0

        iter_epoch = 1

        while state.any() and (iter_epoch <= self.max_iter_epoch):

            nx = X[state][0]

            ny = y[state][0]

            index = (X == nx).argmax()

            self.beta[index] += self.alpha

            self.b += ny

            # 更新条件

            iter_epoch += 1

            state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0

        # 通过beta计算出w

        self.w = ((self.beta * y).reshape(-1, 1) * X).sum(axis = 0)

        print(f"fit perceptron_dual(alpha = {self.alpha}, total_iter_epoch = {min(self.max_iter_epoch, iter_epoch)})")

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        y_predict = np.sign(X @ self.w  + self.b)

        return y_predict

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_score = (self.predict(X) == y).sum() / len(y)

        return y_score

# 二分类的情况（对偶形式）/ 数据集的处理与划分

X = xdata[ydata < 2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 对偶形式验证

ppn = perceptron_dual()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

5. 多分类情况—one vs. rest

假设有k个类别，ovr策略是生成k个分类器，最后选取概率最大的预测结果

class perceptron_ovr(object):

    """

    功能：实现感知机的多分类情形（采用one vs. rest策略）

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.w = None

        self.b = None

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(self.w, X.T) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 生成各分类器对应的标记

        self.y_class = np.unique(y)

        y_ovr = np.vstack([np.where(y == i, 1, -1) for i in self.y_class])

        # 初始化w, b

        self.w = np.zeros([self.y_class.shape[0], X.shape[1]])

        self.b = np.zeros([self.y_class.shape[0], 1])

        # 拟合各分类器，并更新相应维度的w和b

        for index in range(self.y_class.shape[0]):

            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)

            ppn.fit(X, y_ovr[index])

            self.w[index] = ppn.w

            self.b[index] = ppn.b

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        # 值越大，说明第i维的分类器将该点分得越开，即属于该分类器的概率值越大

        y_predict = self.linear_model(X).argmax(axis = 0)

        # 还原原数据集的标签

        for index in range(self.y_class.shape[0]):

            y_predict = np.where(y_predict == index, self.y_class[index], y_predict)

        return y_predict

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_score = (self.predict(X) == y).sum()/len(y)

        return y_score

# 多分类数据集处理

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. rest的验证

ppn = perceptron_ovr()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

6. 多分类情况—one vs. one

假设有k个类别，生成k(k-1)/2个二分类器，最后通过多数投票来选取预测结果

from itertools import combinations

class perceptron_ovo(object):

    """

    功能：实现感知机的多分类情形（采用one vs. one策略）

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.w = None

        self.b = None

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(self.w, X.T) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 生成各分类器对应的标记（使用排列组合）

        self.y_class = np.unique(y)

        self.y_combine = [i for i in combinations(self.y_class, 2)]

        # 初始化w和b

        clf_num = len(self.y_combine)

        self.w = np.zeros([clf_num, X.shape[1]])

        self.b = np.zeros([clf_num, 1])

        for index, label in enumerate(self.y_combine):

            # 根据各分类器的标签选取数据集

            cond = pd.Series(y).isin(pd.Series(label))

            xdata, ydata = X[cond], y[cond]

            ydata = np.where(ydata == label[0], 1, -1)

            # 拟合各分类器，并更新相应维度的w和b

            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)

            ppn.fit(xdata, ydata)

            self.w[index] = ppn.w

            self.b[index] = ppn.b

    def voting(self, y):

        """

        功能：投票

        参数 y：各分类器的预测结果，接受的是元组如(1, 1, 2)

        """

        # 统计分类器预测结果的出现次数

        y_count = np.unique(np.array(y), return_counts = True)

        # 返回出现次数最大的结果位置索引

        max_index = y_count[1].argmax()

        # 返回某个实例投票后的结果

        y_predict = y_count[0][max_index]

        return y_predict

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        # 预测结果

        y_predict = np.sign(self.linear_model(X))

        # 还原标签（根据排列组合的标签）

        for index, label in enumerate(self.y_combine):

            y_predict[index] = np.where(y_predict[index] == 1, label[0], label[1])

        # 列为某一个实例的预测结果，打包用于之后的投票

        predict_zip = zip(*(i.reshape(-1) for i in np.vsplit(y_predict, self.y_class.shape[0])))

        # 投票得到预测结果

        y_predict = list(map(lambda x: self.voting(x), list(predict_zip)))

        return np.array(y_predict)

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_predict = self.predict(X)

        y_score = (y_predict == y).sum() / len(y)

        return y_score

# 多分类数据集处理

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. one的验证

ppn = perceptron_ovo()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

准确率一般比one vs. rest要高，但是生成的分类器多

7. sklearn实现

主要使用sklearn中的Perceptron模块，其中可以实现多分类的情况（默认采用one vs. rest）

from sklearn.linear_model import Perceptron

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

ppn = Perceptron(max_iter = 1000)

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示：

8. 感知机算法的作图

from matplotlib.colors import ListedColormap

def decision_plot(X, Y, clf, test_idx = None, resolution = 0.02):

    """

    功能：画分类器的决策图

    参数 X：输入实例

    参数 Y：实例标记

    参数 clf：分类器

    参数 test_idx：测试集的index

    参数 resolution：np.arange的间隔大小

    """

    # 标记和颜色设置

    markers = ['o', 's', 'x', '^', '>']

    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')

    cmap = ListedColormap(colors[:len(np.unique(Y))])

    # 图形范围

    xmin, xmax = X[:, 0].min() - 1, X[:, 0].max() + 1

    ymin, ymax = X[:, 1].min() - 1, X[:, 1].max() + 1

    x = np.arange(xmin, xmax, resolution)

    y = np.arange(ymin, ymax, resolution)

    # 网格

    nx, ny = np.meshgrid(x, y)

    # 数据合并

    xdata = np.c_[nx.reshape(-1), ny.reshape(-1)]

    # 分类器预测

    z = clf.predict(xdata)

    z = z.reshape(nx.shape)

    # 作区域图

    plt.contourf(nx, ny, z, alpha = 0.4, cmap = cmap)

    plt.xlim(nx.min(), nx.max())

    plt.ylim(ny.min(), ny.max())

    # 画点

    for index, cl in enumerate(np.unique(Y)):

        plt.scatter(x=X[Y == cl, 0], y=X[Y == cl, 1],

                    alpha=0.8, c = cmap(index),

                    marker=markers[index], label=cl)

    # 突出测试集的点

    if test_idx:

        X_test, y_test = X[test_idx, :], y[test_idx]

        plt.scatter(X_test[:, 0],

                    X_test[:, 1],

                    alpha=0.15,

                    linewidths=2,

                    marker='^',

                    edgecolors='black',

                    facecolors='none',

                    s=55, label='test set')

# 作图时的数据处理

X = xdata[ydata < 2, :2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

ppn = model_perceptron()

ppn.fit(xtrain, ytrain)

decision_plot(X, y, ppn)

plt.legend()

结果显示：

感知机算法（PLA）代码实现的更多相关文章

机器学习---用python实现感知机算法和口袋算法（Machine Learning PLA Pocket Algorithm Application）
之前在<机器学习---感知机(Machine Learning Perceptron)>一文中介绍了感知机算法的理论知识,现在让我们来实践一下. 有两个数据文件:data1和data2,分 ...
机器学习算法--Perceptron(感知机)算法
感知机: 假设输入空间是$\chi\subseteq R^n$,输出空间是$\gamma =\left( +1,-1\right)$.输入$\chi\in X$表示实例的特征向量,对应于输 ...
DeepLearning tutorial（3）MLP多层感知机原理简介+代码详解
本文介绍多层感知机算法,特别是详细解读其代码实现,基于python theano,代码来自:Multilayer Perceptron,如果你想详细了解多层感知机算法,可以参考:UFLDL教程,或者参 ...
机器学习笔记（一）· 感知机算法 · 原理篇
这篇学习笔记强调几何直觉,同时也注重感知机算法内部的动机.限于篇幅,这里仅仅讨论了感知机的一般情形.损失函数的引入.工作原理.关于感知机的对偶形式和核感知机,会专门写另外一篇文章.关于感知机的实现代码 ...
感知机算法及BP神经网络
简介:感知机在1957年就已经提出,可以说是最为古老的分类方法之一了.是很多算法的鼻祖,比如说BP神经网络.虽然在今天看来它的分类模型在很多数时候泛化能力不强,但是它的原理却值得好好研究.先学好感知机 ...
Python实现各种排序算法的代码示例总结
Python实现各种排序算法的代码示例总结作者:Donald Knuth 字体:[增加减小] 类型:转载时间:2015-12-11我要评论这篇文章主要介绍了Python实现各种排序算法的代码示 ...
10个经典的C语言面试基础算法及代码
10个经典的C语言面试基础算法及代码作者:码农网 – 小峰原文地址:http://www.codeceo.com/article/10-c-interview-algorithm.html 算法是一 ...
经典面试题（二）附答案算法+数据结构+代码微软Microsoft、谷歌Google、百度、腾讯
1.正整数序列Q中的每个元素都至少能被正整数a和b中的一个整除,现给定a和b,需要计算出Q中的前几项, 例如,当a=3,b=5,N=6时,序列为3,5,6,9,10,12 (1).设计一个函数void ...
php四种排序算法实现代码
分享php排序的四种算法与代码. 冒泡:function bubble_sort($arr){ $num = count($arr); for($i=0;$i<$num;$i++){ for($ ...

随机推荐

Java CRC16 MODBUS校验算法实现
/** * CRC校验算法工具类 */ public class CRCUtil { public static String getCRC(String data) { data = data.re ...
junit配合catubuter统计单元测试的代码覆盖率
1.视频参考孔浩老师ant视频笔记对应的build-junit.xml脚步如下所示: <?xml version="1.0" encoding="UTF-8&qu ...
001_动力节点_SpringMVC4_SpringMVC简介
1.视频的下载地址是下载地址:百度云盘链接:http://pan.baidu.com/s/1ge58XW3 密码:yd5jhttp://www.java1234.com/a/javaziliao/ ...
计算机网络之tcp三次握手
客户端与服务器之间数据的发送和返回的过程当中需要创建一个叫TCP connection的东西:由于TCP不存在连接的概念,只存在请求和响应,请求和响应都是数据包,它们之间都是经过由TCP创建的一个从客 ...
入门大数据---Hbase容灾与备份
一.前言本文主要介绍 Hbase 常用的三种简单的容灾备份方案,即CopyTable.Export/Import.Snapshot.分别介绍如下: 二.CopyTable 2.1 简介 CopyTa ...
作为一个Java开发你用过Jib吗
1. 前言 Jib是Google开发的可以直接构建 Java应用的Docker和OCI镜像的类库,以Maven和Gradle插件形式提供.它最骚操作的是可以在没有Docker守护程序的情况下构建,也就 ...
vue-elemnt-admin源码学习
vue-elemnt-admin源码学习 vue-element-admin是一个基于vue,element-ui的集成的管理后台.它的安装部分就不说了,按照官网的步骤一步步就可以执行了. https ...
Springboot--元注解及自定义注解（表单验证）
本文简单说明一下元注解,然后对元注解中的@Retention做深入的讨论,在文章最后使用元注解写一个自定义注解来结尾. 一.结论: @Target:注解的作用目标 @Target(ElementTyp ...
git和github入门指南（4）
4.分支管理 4.1.什么是分支? 分支可以简单的理解为分叉,在主干上长出一条枝干出来,主干分支通常叫做master,在主分支上可以开很多分支出来,不同的人在不同的分支上做开发,最后合并到主分支,这样 ...
vue基础入门（2.1）
2.vue基础用法 2.1.事件处理 2.1.1.监听事件使用v-on:事件名称 = '事件处理函数'的形式来监听事件,事件处理函数要写在methods后面的对象中 <!DOCTYPE htm ...

感知机算法（PLA）代码实现

1. 引言

2. 载入库和数据处理

3. 感知机的原始形式

4. 感知机的对偶形式

5. 多分类情况—one vs. rest

6. 多分类情况—one vs. one

7. sklearn实现

8. 感知机算法的作图

感知机算法（PLA）代码实现的更多相关文章

随机推荐

热门专题