使用支持向量机训练mnist数据

 # encoding: utf-8

 import numpy as np

 import matplotlib.pyplot as plt

 import cPickle

 import gzip

 class SVC(object):

     def __init__(self, c=1.0, delta=0.001):  # 初始化

         self.N = 0

         self.delta = delta

         self.X = None

         self.y = None

         self.w = None

         self.wn = 0

         self.K = np.zeros((self.N, self.N))

         self.a = np.zeros((self.N, 1))

         self.b = 0

         self.C = c

         self.stop=1

         self.k=0

         self.cls=0

         self.train_result=[]

     def kernel_function(self,x1, x2):  # 核函数

         return np.dot(x1, x2)

     def kernel_matrix(self, x):  # 核矩阵

         for i in range(0, len(x)):

             for j in range(i, len(x)):

                 self.K[j][i] = self.K[i][j] = self.kernel_function(self.X[i], self.X[j])

     def get_w(self):  # 计算更新w

         ay = self.a * self.y

         w = np.zeros((1, self.wn))

         for i in range(0, self.N):

             w += self.X[i] * ay[i]

         return w

     def get_b(self, a1, a2, a1_old, a2_old):  # 计算更新B

         y1 = self.y[a1]

         y2 = self.y[a2]

         a1_new = self.a[a1]

         a2_new = self.a[a2]

         b1_new = -self.E[a1] - y1 * self.K[a1][a1] * (a1_new - a1_old) - y2 * self.K[a2][a1] * (

             a2_new - a2_old) + self.b

         b2_new = -self.E[a2] - y1 * self.K[a1][a2] * (a1_new - a1_old) - y2 * self.K[a2][a2] * (

             a2_new - a2_old) + self.b

         if (0 < a1_new) and (a1_new < self.C) and (0 < a2_new) and (a2_new < self.C):

             return b1_new[0]

         else:

             return (b1_new[0] + b2_new[0]) / 2.0

     def gx(self, x):  # 判别函数g(x)

         return np.dot(self.w, x) + self.b

     def satisfy_kkt(self, a):  # 判断样本点是否满足kkt条件

         index = a[1]

         if a[0] == 0 and self.y[index] * self.gx(self.X[index]) > 1:

             return 1

         elif a[0] < self.C and self.y[index] * self.gx(self.X[index]) == 1:

             return 1

         elif a[0] == self.C and self.y[index] * self.gx(self.X[index]) < 1:

             return 1

         return 0

     def clip_func(self, a_new, a1_old, a2_old, y1, y2):  # 拉格朗日乘子的裁剪函数

         if (y1 == y2):

             L = max(0, a1_old + a2_old - self.C)

             H = min(self.C, a1_old + a2_old)

         else:

             L = max(0, a2_old - a1_old)

             H = min(self.C, self.C + a2_old - a1_old)

         if a_new < L:

             a_new = L

         if a_new > H:

             a_new = H

         return a_new

     def update_a(self, a1, a2):  # 更新a1,a2

         partial_a2 = self.K[a1][a1] + self.K[a2][a2] - 2 * self.K[a1][a2]

         if partial_a2 <= 1e-9:

             print "error:", partial_a2

         a2_new_unc = self.a[a2] + (self.y[a2] * ((self.E[a1] - self.E[a2]) / partial_a2))

         a2_new = self.clip_func(a2_new_unc, self.a[a1], self.a[a2], self.y[a1], self.y[a2])

         a1_new = self.a[a1] + self.y[a1] * self.y[a2] * (self.a[a2] - a2_new)

         if abs(a1_new - self.a[a1]) < self.delta:

             return 0

         self.a[a1] = a1_new

         self.a[a2] = a2_new

         self.is_update = 1

         return 1

     def update(self, first_a):  # 更新拉格朗日乘子

         for second_a in range(0, self.N):

             if second_a == first_a:

                 continue

             a1_old = self.a[first_a]

             a2_old = self.a[second_a]

             if self.update_a(first_a, second_a) == 0:

                 return

             self.b= self.get_b(first_a, second_a, a1_old, a2_old)

             self.w = self.get_w()

             self.E = [self.gx(self.X[i]) - self.y[i] for i in range(0, self.N)]

             self.stop=0

     def train(self, x, y, max_iternum=100):  # SMO算法

         x_len = len(x)

         self.X = x

         self.N = x_len

         self.wn = len(x[0])

         self.y = np.array(y).reshape((self.N, 1))

         self.K = np.zeros((self.N, self.N))

         self.kernel_matrix(self.X)

         self.b = 0

         self.a = np.zeros((self.N, 1))

         self.w = self.get_w()

         self.E = [self.gx(self.X[i]) - self.y[i] for i in range(0, self.N)]

         self.is_update = 0

         for i in range(0, max_iternum):

             self.stop=1

             data_on_bound = [[x,y] for x,y in zip(self.a, range(0, len(self.a))) if x > 0 and x< self.C]

             if len(data_on_bound) == 0:

                 data_on_bound = [[x,y] for x,y in zip(self.a, range(0, len(self.a)))]

             for data in data_on_bound:

                 if self.satisfy_kkt(data) != 1:

                     self.update(data[1])

             if self.is_update == 0:

                 for data in [[x,y] for x,y in zip(self.a, range(0, len(self.a)))]:

                     if self.satisfy_kkt(data) != 1:

                         self.update(data[1])

             if self.stop:

                 break

         return self.w, self.b

     def fit(self,x, y):  # 训练模型, 一对一法k(k-1)/2个SVM进行多类分类

         self.cls, y = np.unique(y, return_inverse=True)

         self.k=len(self.cls)

         for i in range(self.k):

             for j in range(i):

                 a,b=self.sub_data(x,y,i,j)

                 self.train_result.append([i,j,self.train(a,b)])

     def predict(self,x_new):  # 预测

          p=np.zeros(self.k)

          for i,j,w in self.train_result:

              self.w=w[0]

              self.b=w[1]

              if self.classfy(x_new)==1:

                  p[j]+=1

              else:

                  p[i]+=1

          return self.cls[np.argmax(p)]

     def sub_data(self,x,y,i,j):  # 数据分类

         subx=[]

         suby=[]

         for a,b in zip(x,y):

             if b==i:

                  subx.append(a)

                  suby.append(-1)

             elif b==j:

                  subx.append(a)

                  suby.append(1)

         return subx,suby

     def classfy(self,x_new):  # 预测

         y_new=self.gx(x_new)

         cl = int(np.sign(y_new))

         if cl == 0:

             cl = 1

         return cl

 def load_data():

     f = gzip.open('../data/mnist.pkl.gz', 'rb')

     training_data, validation_data, test_data = cPickle.load(f)

     f.close()

     return (training_data, validation_data, test_data)

 if __name__ == "__main__":

     svc = SVC()

     np.random.seed(0)

     l=1000

     training_data, validation_data, test_data = load_data()

     svc.fit(training_data[0][:l],training_data[1][:l])

     predictions = [svc.predict(a) for a in test_data[0][:l]]

     num_correct = sum(int(a == y) for a, y in zip(predictions, test_data[1][:l]))

     print "%s of %s values correct." % (num_correct, len(test_data[1][:l]))  #72/100  #808/1000  #8194/10000(较慢）

使用支持向量机训练mnist数据的更多相关文章

tensorflow学习笔记——使用TensorFlow操作MNIST数据（2）
tensorflow学习笔记——使用TensorFlow操作MNIST数据(1) 一:神经网络知识点整理 1.1,多层:使用多层权重,例如多层全连接方式以下定义了三个隐藏层的全连接方式的神经网络样例 ...
tensorflow学习笔记——使用TensorFlow操作MNIST数据（1）
续集请点击我:tensorflow学习笔记——使用TensorFlow操作MNIST数据(2) 本节开始学习使用tensorflow教程,当然从最简单的MNIST开始.这怎么说呢,就好比编程入门有He ...
【OpenCV】opencv3.0中的SVM训练 mnist 手写字体识别
前言: SVM(支持向量机)一种训练分类器的学习方法 mnist 是一个手写字体图像数据库,训练样本有60000个,测试样本有10000个 LibSVM 一个常用的SVM框架 OpenCV3.0 中的 ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
LeNet训练MNIST
jupyter notebook: https://github.com/Penn000/NN/blob/master/notebook/LeNet/LeNet.ipynb LeNet训练MNIST ...
使用Tensorflow操作MNIST数据
MNIST是一个非常有名的手写体数字识别数据集,在很多资料中,这个数据集都会被用作深度学习的入门样例.而TensorFlow的封装让使用MNIST数据集变得更加方便.MNIST数据集是NIST数据集的 ...
TensorFlow训练MNIST数据集（3） —— 卷积神经网络
前面两篇随笔实现的单层神经网络和多层神经网络, 在MNIST测试集上的正确率分别约为90%和96%.在换用多层神经网络后,正确率已有很大的提升.这次将采用卷积神经网络继续进行测试. 1.模型基本结构 ...
TensorFlow 训练MNIST数据集（2）—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...

随机推荐

jsp MVC学习笔记
Model层: 四个包: com.maker.bean存放数据库里面的字段信息. package com.maker.bean; public class User { private String ...
BZOJ 1630/2023 Ant Counting 数蚂蚁
DP. #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> ...
IOS 作业项目 TableView两个section中cell置顶功能实现
点击cell会置顶,其他的下移
Win7 登入提示临时漫游档案
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\ProfileList
Selenium - IWebDriver 控制scroll bar到底部
有时候我们需要控制页面滚动条上的滚动条,但滚动条并非页面上的元素,这个时候就需要借助js是来进行操作.一般用到操作滚动条的会两个场景: 注册时的法律条文需要阅读,判断用户是否阅读的标准是:滚动条是否拉 ...
MINIX3 导读分析
一个操作系统的分析是属于一个非常庞大的工程,操作系统就像是一个人造的人,每一个模块想完全发挥功效,很有可能需要很多模块的支持才能够实现.所以在分析 MINIX3 时,我认为同时看多个模块对于理解 ...
Gitlab. Disable user creation on welcome page
Login to your Gitlab > Admin area > settings > Features > remove the check mark "Si ...
java 函数运算符
1. 函数的重载:多个函数名相同,根据参数列表(个数,类型)选择执行不同函数,不能按返回值类型区分. 2. 运算符: / /两头都是int类型则做求商运算,如果一头有小数就做正常的除运算 5/2 / ...
【转】Java中如何遍历Map对
在Java中如何遍历Map对象 How to Iterate Over a Map in Java 在java中遍历Map有不少的方法.我们看一下最常用的方法及其优缺点. 既然java中的所有map都 ...
跟开涛老师学shiro -- shiro简介
1.1 简介 Apache Shiro是Java的一个安全框架.目前,使用Apache Shiro的人越来越多,因为它相当简单,对比Spring Security,可能没有Spring Securi ...

使用支持向量机训练mnist数据

使用支持向量机训练mnist数据的更多相关文章

随机推荐

热门专题