机器学习分类算法

本章将介绍最早以算法方式描述的分类机器学习算法：感知器（perceptron）和自适应线性神经元。

人造神经元——早期机器学习概览

MP神经元

生物神经元和MP神经元模型的对应关系如下表：

这个结构非常简单，如果你还记得前面所讲的M-P神经元的结构的话，这个图其实就是输入输出两层神经元之间的简单连接

单层感知器的局限性

虽然单层感知器简单而优雅，但它显然不够聪明——它仅对线性问题具有分类能力。什么是线性问题呢？简单来讲，就是用一条直线可分的图形。比如，逻辑“与”和逻辑“或”就是线性问题，我们可以用一条直线来分隔0和1。

1）逻辑“与”的真值表和二维样本图如图2：

2）逻辑“或”的真值表如图3：

为什么感知器就可以解决线性问题呢？这是由它的传递函数决定的。这里以两个输入分量 x1 和 x2 组成的二维空间为例，此时节点 j 的输出为

所以，方程

确定的直线就是二维输入样本空间上的一条分界线。对于三维及更高维数的推导过程可以参考其他的Tutorials。

如果要让它来处理非线性的问题，单层感知器网就无能为力了。例如下面的“异或”，就无法用一条直线来分割开来，因此单层感知器网就没办法实现“异或”的功能。

使用Python 实现感知器学习算法

Perceptron.py

import numpy as np

#eta是学习率  n_iter是迭代次数

#errors_是每个阶段的错误数

#w_是权重吧

class Percetron(object):

    def __init__(self,eta=0.01,n_iter=10):

        self.eta=eta

        self.n_iter=n_iter

    def fit(self,X,y):

        self.w_=np.zeros(1+X.shape[1])#X的列数+1

        self.errors_=[]

        for _ in range(self.n_iter):#迭代次数

            errors=0

            for xi,target in zip(X,y):#将X,y组成

                update=self.eta*(target-self.predict(xi))#预测目标和实际目标是否相同

                self.w_[1:]+=update*xi#更新

                self.w_[0]+=update#更新b

                errors+=int(update != 0.0)#记录这次迭代的错误数

            self.errors_.append(errors)

        return  self#关键返回参数W

    def net_input(self,X):#输入X,输出结果

        return np.dot(X,self.w_[1:])+self.w_[0]

    def predict(self,X):

        return np.where(self.net_input(X)>=0.0,1,-1)#如果结果大于等于0，返回1，否则返回0

main.py

import pandas as pd

import matplotlib.pyplot as plt

import numpy as np

import Percetron as P

from matplotlib.colors import ListedColormap

def plot_decision_regions(X,y,classifier,resolution=0.02):#绘制决策边界

    markers=('s','x','o','^','v')#标记

    colors=('red','blue','lightgreen','gray','cyan')#颜色

    cmap=ListedColormap(colors[:len(np.unique(y))])#定义一些颜色和标记符号，并通过颜色列表生成了颜色示例图

    x1_min,x1_max=X[:,0].min()-1,X[:,0].max()+1#对最大值和最小值做出限定

    x2_min,x2_max=X[:,1].min()-1,X[:,1].max()+1

    xx1,xx2=np.meshgrid(np.arange(x1_min,x1_max,resolution),np.arange(x2_min,x2_max,resolution))

    Z=classifier.predict(np.array([xx1.ravel(),xx2.ravel()]).T)

    z=Z.reshape(xx1.shape)

    plt.xlim(xx1.min(),xx1.max())#x轴范围

    plt.ylim(xx2.min(),xx2.max())#y轴范围

    for idx,c1 in enumerate(np.unique(y)):

        plt.scatter(x=X[y==c1,0],y=X[y==c1,1],alpha=0.8,c=cmap(idx),marker=markers[idx],label=c1)

if __name__ == "__main__":

    df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)

    df.tail()  # 用于显示数据的最后五行以确保加载成功

    y=df.iloc[0:100,4].values#此时y是类别名称

    y=np.where(y=='Iris-setosa',-1,1)#若是这个名称则为-1，不是则为1

    X=df.iloc[0:100,[0,2]].values#从表中获得X

    plt.scatter(X[:50,0],X[:50,1],color='red',marker='o',label='setosa')

    plt.scatter(X[50:100,0],X[50:100,1],color='blue',marker='x',label='versicolor')

    plt.xlabel('petal length')

    plt.ylabel('sepal length')

    plt.legend(loc='upper left')

    plt.show()

    ppn=P.Percetron(eta=0.1,n_iter=10)#初始化感知器

    ppn.fit(X,y)#拟合感知器

    plt.plot(range(1,len(ppn.errors_)+1),ppn.errors_,marker='o')#横坐标从1到len(errors_),纵坐标为errors_，

    plt.xlabel('Epochs')

    plt.ylabel('Number of misclassifications')

    plt.show()

    plot_decision_regions(X,y,classifier=ppn)

    plt.xlabel('sepal length [cm]')

    plt.ylabel('petal length [cm]')

    plt.legend(loc='upper left')

    plt.show()

自适应线性神经元及其学习的收敛性

在之前的文章感知机中提到过，感知机分类器是一个非常好的二分类分类器。

但是感知机分类器仍然存在两个比较明显的缺陷：

感知机模型只能针对线性可分的数据集，对于非线性可分的数据集，无能为力
当两个类可由线性超平面分离时，感知器学习规则收敛，但当类无法由线性分类器完美分离

为了解决感知机的这两个主要的缺陷，就有了现在要讲的自适应线性神经元

在之前的感知机中，感知机的激活函数是阶跃函数，这里改为线性激活函数（linear activation function）,一般来说，为了方便，可以直接取：

感知机框架和自适应线性神经元框架对比，注意，自适应线性神经元框架比感知机框架多了一个量化器（quantizer），其主要作用是得到样本的类别。

梯度下降法（Gradient Descent）

相对于阶跃函数而言，线性函数有一个明显的优点：函数是可微（differentiable）的。这就使得我们可以直接在这个函数上定义损失函数 J(W)（cost function），并对其进行优化。这里定义损失函数J(W)为平方损失误差和（SSE： sum of squared errors），这里假设训练样本集合的大小为n ：

AdalineGD.py

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

class AdalineGD(object):

    def __init__(self,eta=0.01,n_iter=50):

        self.eta=eta

        self.n_iter=n_iter

    def fit(self,X,y):

        self.w_=np.zeros(1+X.shape[1])

        self.cost_=[]

        for i in range(self.n_iter):

            output=self.net_input(X)

            errors=(y-output)

            self.w_[1:]+=self.eta*X.T.dot(errors)

            self.w_[0]+=self.eta*errors.sum()

            cost=(errors**2).sum()/2

            self.cost_.append(cost)

        return self

    def net_input(self,X):

        return np.dot(X,self.w_[1:])+self.w_[0]

    def activation(self,X):

        return self.net_input(X)

    def predict(self,X):

        return np.where(self.activation(X)>=0,1,-1)

if __name__ == "__main__":

    df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)

    df.tail()  # 用于显示数据的最后五行以确保加载成功

    y = df.iloc[0:100, 4].values  # 此时y是类别名称

    y = np.where(y == 'Iris-setosa', -1, 1)  # 若是这个名称则为-1，不是则为1

    X = df.iloc[0:100, [0, 2]].values  # 从表中获得X

    fig,ax=plt.subplots(nrows=1,ncols=2,figsize=(8,4))

    ada1=AdalineGD(n_iter=10,eta=0.01).fit(X,y)

    ax[0].plot(range(1,len(ada1.cost_)+1),np.log10(ada1.cost_),marker='o')

    ax[0].set_xlabel('Epochs')

    ax[0].set_ylabel('log(Sum-squared-error)')

    ax[0].set_title('Adaline-Learning rate 0.01')

    ada2=AdalineGD(n_iter=10,eta=0.0001).fit(X,y)

    ax[1].plot(range(1,len(ada2.cost_)+1),ada2.cost_,marker='o')

    ax[1].set_xlabel('Epochs')

    ax[1].set_ylabel('Sum-squared-error')

    ax[1].set_title('Adaline-Learning rate 0.0001')

    plt.show()

《Python 机器学习》笔记（二）的更多相关文章

CSS3 笔记二（Gradients）
CSS3 Gradients Two types of gradients: Linear Gradients (goes down/up/left/right/diagonally) Radial ...
图解CSS3核心技术与案例实战（1）
前言: 我买了一本<图解CSS3核心技术与案例实战>大漠写的,为了提高自己的自觉性呢,抓紧看书,把读书笔记放在这上面,跟大家一起分享,也为督促自己完成读书计划. 文末有微信公众号,感谢你的 ...
纯JS实现KeyboardNav(学习笔记)二
纯JS实现KeyboardNav(学习笔记)二这篇博客只是自己的学习笔记,供日后复习所用,没有经过精心排版,也没有按逻辑编写这篇主要是添加css,优化js编写逻辑和代码排版 GitHub项目源码 ...
图解CSS3制作圆环形进度条的实例教程
圆环形进度条制作的基本思想还是画出基本的弧线图形,然后CSS3中我们可以控制其旋转来串联基本图形,制造出部分消失的效果,下面就来带大家学习图解CSS3制作圆环形进度条的实例教程首先,当有人说你能不能 ...
《CMake实践》笔记二：INSTALL/CMAKE_INSTALL_PREFIX
<CMake实践>笔记一:PROJECT/MESSAGE/ADD_EXECUTABLE <CMake实践>笔记二:INSTALL/CMAKE_INSTALL_PREFIX &l ...
jQuery源码笔记(二)：定义了一些变量和函数 jQuery = function(){}
笔记(二)也分为三部分: 一. 介绍: 注释说明:v2.0.3版本.Sizzle选择器.MIT软件许可注释中的#的信息索引.查询地址(英文版)匿名函数自执行:window参数及undefined参数意 ...
Mastering Web Application Development with AngularJS 读书笔记(二)
第一章笔记 (二) 一.scopes的层级和事件系统(the eventing system) 在层级中管理的scopes可以被用做事件总线.AngularJS 允许我们去传播已经命名的事件用一种有效 ...
Python 学习笔记二
笔记二 :print 以及基本文件操作笔记一已取消置顶链接地址 http://www.cnblogs.com/dzzy/p/5140899.html 暑假只是快速过了一遍python ,现在起开始仔 ...
WPF的Binding学习笔记(二)
原文: http://www.cnblogs.com/pasoraku/archive/2012/10/25/2738428.htmlWPF的Binding学习笔记(二) 上次学了点点Binding的 ...
webpy使用笔记(二) session/sessionid的使用
webpy使用笔记(二) session的使用 webpy使用系列之session的使用,虽然工作中使用的是django,但是自己并不喜欢那种大而全的东西~什么都给你准备好了,自己好像一个机器人一样赶 ...

随机推荐

poj 2828 Buy Tickets （线段树单节点查询位置更新）
Buy Tickets Time Limit: 4000MS Memory Limit: 65536K Total Submissions: 15533 Accepted: 7759 Desc ...
hdu 4821 字符串hash+map判重 String (长春市赛区I题)
http://acm.hdu.edu.cn/showproblem.php?pid=4821 昨晚卡了非常久,開始TLE,然后优化了之后,由于几个地方变量写混.一直狂WA.搞得我昨晚都失眠了,,. 这 ...
指尖上的电商---(11)Windows平台部署SolrCloud
SolrCloud是一种分布式解决方式,是基于zookeeper和solr的,能够简单理解为一种集群,能够提供分布式查询.分布式写索引. SolrCloud的结构大致是这种,一个SolrCloud包含 ...
Pairs Forming LCM 在a,b中(a,b<=n)(1 ≤ n ≤ 10^14),有多少组(a,b) (a<b)满足lcm(a,b)==n; lcm(a,b)=p1 ^ max(a1,b1) * p2 ^ max(a2,b2) *..........*pn ^ max(an,bn)
转自:http://www.cnblogs.com/shentr/p/5285407.html http://acm.hust.edu.cn/vjudge/contest/view.action?ci ...
innodb_flush_log_at_trx_commit和sync_binlog参数详解
innodb_flush_log_at_trx_commit和sync_binlog参数详解标签: innodb_flush_ ...
Gold Balanced Lineup - poj 3274 (hash)
这题,看到别人的解题报告做出来的,分析: 大概意思就是: 数组sum[i][j]表示从第1到第i头cow属性j的出现次数. 所以题目要求等价为: 求满足 sum[i][0]-sum[j][0]=sum ...
Nodejs各种功能Module的收集整理
收集整理接触过的各种常用的nodejs modules,不断更新~~~ ================================================================ ...
（转载）将一段符合XML格式规范字符串插入已有XML文档当中
想我们已经存在一个XML文档,结构如下: < xmlversion="1.0"encoding="utf-8">< employees&g ...
有向图加最少的边成为强连通分量的证明 poj 1236 hdu 2767
poj 1236: 题目大意:给出一个有向图, 任务一: 求最少的点,使得从这些点出发可以遍历整张图任务二: 求最少加多少边使整个图变成一个强连通分量. 首先任务一很好做, 只要缩点之后求 ...
java输出
把一个java对象转化成一个json字符串: JSON.toJSON(user); JSON.toJSONStringWithDateFormat(user, "yyyy-MM-dd HH: ...

《Python 机器学习》笔记（二）