概述

在机器学习中，感知机（perceptron）是二分类的线性分类模型，属于监督学习算法。输入为实例的特征向量，输出为实例的类别（取+1和-1）。

感知机对应于输入空间中将实例划分为两类的分离超平面。感知机旨在求出该超平面，为求得超平面导入了基于误分类的损失函数，利用梯度下降法 对损失函数进行最优化（最优化）。

感知机的学习算法具有简单而易于实现的优点，分为原始形式和对偶形式。感知机预测是用学习得到的感知机模型对新的实例进行预测的，因此属于判别模型。

感知机由Rosenblatt于1957年提出的，是神经网络和支持向量机的基础。

定义

假设输入空间(特征向量)为，输出空间为。

输入

表示实例的特征向量，对应于输入空间的点；

输出

表示示例的类别。

由输入空间到输出空间的函数为

称为感知机。其中，参数w叫做权值向量(weight)，b称为偏置(bias)。表示w和x的点积

sign为符号函数，即

感知机算法就是要找到一个超平面将我们的数据分为两部分。

超平面就是维度比我们当前维度空间小一个维度的空间，例如：我们当前的维度是二维的空间（由数据维度确定，x有多少列就有多大的维度），那么超平面就是一维的，即一条直线。如下图

算法步骤

数据集：

其中：

我们现在就是要找到一个超平面：

将数据集划分为正负两部分：

如果能得到这样一个超平面，则称我们的数据集T是线性可分的，否则称数据集T是线性不可分的

损失函数

感知机的损失函数是误分类点到超平面S的总距离

对于误分类的点：

假设误分类点的集合为M，所有误分类点到超平面S的距离：

所以感知机的损失函数为：

我们的问题就是要找到最优的w， b，使得损失函数最小。

梯度下降算法

我们采用梯度下降算法：

梯度下降法就是利用导数，然后沿着导数的方向下降，最后得到最优的解，如图：

首先选择w0, b0,一般初始化为0.

然后分别对w, b求导：

选择合适的步长，我们称为学习率。

更新w,b:

这样，通过不断的更新w, b, 减小了损失函数，我们得到了最优的解

感知机算法代码

代码在这里，翻我牌子

制作数据

%pylab

%matplotlib inline

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

iris = load_iris()#导入iris数据集

data = iris.data

data = data[:100]

labels = iris.target

labels = labels[:100]

feature_name = iris.feature_names

print("feature_name", feature_name)

#我们选择了sepal length (cm)', 'sepal width (cm)'，并且更改了labels

data = data[:, 0:2]

labels[labels == 0] = -1

feature_name = feature_name[:2]

X_train, X_test, y_train, y_test = train_test_split(data, labels)#划分数据集

定义类

class my_perceptron():

    #初始化w，b，学习率

    def __init__(self, lr=0.01):

        self.w = 0

        self.b = 0

        self.lr = lr

    def fit(self, X, y):

        w = np.zeros(len(X[0]))

        b = 0

        lr = self.lr

        all_true = False

        #只要存在误分类点就继续循环

        while not all_true:

            all_true = True

            for i in range(len(X)):

                #误分类条件

                if y[i]*(np.dot(w, X[i]) + b) <= 0:

                    all_true = False

                    #更新w，b

                    w += lr*y[i]*X[i]

                    b += lr*y[i]

        self.w = w

        self.b = b

    def predict(self, X):

        res = []

        for i in range(len(X)):

            if np.dot(self.w, X[i]) + b <= 0:

                res.append(-1)

            else:

                res.append(1)

        return np.array(res)

    def score(self, y_predict, y_test):

        return np.mean(y_predict == y_test)

代码测试

clf = my_perceptron()

clf.fit(X_train, y_train)

w = clf.w

b = clf.b

#绘图查看

plt.scatter(train[:50, 0], train[:50, 1])

plt.scatter(train[50:-1, 0], train[50:-1, 1])

xx = np.linspace(train[:, 0].min(), train[:, 0].max(), 100)

yy = -(w[0]*xx + b)/w[1]

plt.plot(xx, yy)

plt.xlabel(feature_names[0])

plt.ylabel(feature_names[1])

感知机分类（perceptron classification）的更多相关文章

关于情感分类(Sentiment Classification)的文献整理
最近对NLP中情感分类子方向的研究有些兴趣,在此整理下个人阅读的笔记(持续更新中): 1. Thumbs up? Sentiment classification using machine lear ...
【分类算法】感知机（Perceptron）
0 - 算法描述感知机算法是一类二分类算法,其问题描述为,给定一个训练数据集 $$T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\},$$ 其中$x_i\in \m ...
Neural Network学习（一）最早的感知机：Perceptron of Rosenblatt
1. Frank Rosenblatt 首先介绍的是神经网络的开山祖师,先放张图拜拜 Frank Rosenblatt出生在纽约,父亲是医生,其1956年在Cornell大学拿到博士学位后,留校任教, ...
用感知机（Perceptron）实现逻辑AND功能的Python3代码
之所以写这篇随笔,是因为参考文章(见文尾)中的的代码是Python2的,放到Python3上无法运行,我花了些时间debug,并记录了调试经过. 参考文章中的代码主要有两处不兼容Python3,一个是 ...
[笔记-统计学习方法]感知机模型(perceptron) 原理与实现
前几天认把感知机这一章读完了,顺带做了点笔记现在把笔记做第三次的整理 (不得不说博客园的LaTex公式和markdown排版真的不太舒服,该考虑在服务器上建一个博客了) 零.总结适用于具有线性可分 ...
感知机（perceptron）
二类分类的线性分类模型,属于判别模型,利用梯度下降法对损失函数进行极小化求得感知机模型分为原始形式和对偶形式,是神经网络和支持向量机的基础由输入控件到输出控件的如下函数: f(x)=sign(W.X ...
第三章——分类（Classification）
3.1 MNIST 本章介绍分类,使用MNIST数据集.该数据集包含七万个手写数字图片.使用Scikit-Learn函数即可下载该数据集: >>> from sklearn.data ...
线性分类 Linear Classification
软分类:y 的取值只有正负两个离散值,例如 {0, 1} 硬分类:y 是正负两类区间中的连续值,例如 [0, 1] 一.感知机主要思想:分错的样本数越少越好用指示函数统计分错的样本数作为损失函数, ...
感知机（perceptron）原理总结
目录 1. 感知机原理 2. 损失函数 3. 优化方法 4. 感知机的原始算法 5. 感知机的对偶算法 6. 从图形中理解感知机的原始算法 7. 感知机算法(PLA)的收敛性 8. 应用场景与缺陷 9 ...

随机推荐

Exchange Server 2010邮件策略与遵从性
本文档附带了一个附档,里面详细的描述了如何在Exchange Server 2010中配置如下内容: 1.邮件分类 2.免责申明 3.配置信息隔离墙 4.邮件审核 5.Exchange 2010与AD ...
09.swoole学习笔记--进程事件
<?php //进程数组 $workers=[]; //创建进程的数据量 $worker_num=; //创建启动进程 ;$i<$worker_num;$i++){ //创建单独新进程 $ ...
【收藏】收集的各种Python爬虫、暗网爬虫、豆瓣爬虫、抖音爬虫 Github1万+星
收集的各种Python爬虫.暗网爬虫.豆瓣爬虫 Github 1万+星磁力搜索网站2020/01/07更新 https://www.cnblogs.com/cilisousuo/p/1209954 ...
九十九、SAP中ALV事件之十二，给ALV的标题栏添加图片
一.在OAER中找一个喜欢的图片,对象标识为“TRVPICTURE04” 二.来到我们的代码区,输入代码三.效果如下很完美
SPOJ RENT 01背包的活用+二分
这个题目给定N航班的发出时间和结束时间以及价值,要求不冲突时间的最大价值第一时间想到经典的N方DP,即对航班按发出时间排一下序之后每个i对前面的都扫一遍时间过不了N有10万,只能想优化了,一开始想 ...
Flink 复杂事物处理
简介 FlinkCEP是在Flink之上实现的复杂事件处理(CEP)库. 它允许你在无界的事件流中检测事件模式,让你有机会掌握数据中重要的事项. Flink CEP 首先需要用户创建定义一个个patt ...
吴裕雄--天生自然JAVA SPRING框架开发学习笔记：Spring JDBCTemplate简介
Spring 框架针对数据库开发中的应用提供了 JDBCTemplate 类,该类是 Spring 对 JDBC 支持的核心,它提供了所有对数据库操作功能的支持. Spring 框架提供的JDBC支持 ...
如何生成 SSH keys, 并在 Github 或 Gitlab 等上添加密钥
1 打开 Git Bash $ 2 输入 dir, 确认当前文件夹,并切换到想存密钥文件即pub文件的路径 $ dir 3 生成密钥命令 ssh-keygen -t rsa -C "{ y ...
idea修改web项目的访问路径
转新建好了项目发现项目只能以localhost:8080这样的访问路径访问到主页,也就是index.jsp 那么之前我用eclipse新建的项目都是localhost:8080/xxx(项目名称)来 ...
Hibernate--(二)增删改查
1.增删改查: public class Test { public static void main(String[] args) { SessionFactory sf = new Configu ...

感知机分类（perceptron classification）

概述

定义