二.代码实现
  
  import numpy as np
  
  from sklearn import datasets
  
  from sklearn.model_selection import train_test_split
  
  from sklearn.linear_model import LogisticRegression
  
  import warnings
  
  warnings.filterwarnings('ignore')
  
  data = datasets.load_breast_cancer()
  
  x = data.data;y = data.target
  
  y[y==0] = -1
  
  x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=1)
  
  omega = np.zeros(x.shape[1])
  
  b = 0
  
  lr = 0.01
  
  C = 1
  
  maxgen = 500
  
  for L in range(maxgen):
  
      error = 1 - (np.dot(x_train,omega)+b)*y_train
  
      index = np.argmax(error)
  
      if error[index] > 0:
  
          omega = (1-lr)*omega + lr*C*y_train[index]*x_train[index,:]
  
          b = b + lr*C*y_train[index]
  
      else:
  
          break
  
  predict_train = np.sign(np.dot(x_train,omega)+b)
  
  train_acc = len(np.where(predict_train==y_train)[0])/len(y_train)
  
  predict_test = np.sign(np.dot(x_test,omega)+b)
  
  test_acc = len(np.where(predict_test==y_test)[0])/len(y_test)
  
  print('Train acc = ',round(train_acc,4),' Test acc = ',round(test_acc,4))
  
  三.SMO算法实现
  
  import numpy as np
  
  from sklearn import datasets
  
  from sklearn import preprocessing
  
  from sklearn.model_selection import train_test_split
  
  from sklearn.svm import SVC
  
  import warnings
  
  warnings.filterwarnings('ignore')
  
  data = datasets.load_breast_cancer()
  
  x = data.data;x = preprocessing.MinMaxScaler().fit_transform(x)
  
  y = data.target;y[y==0] = -1
  
  x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=1)
  
  alpha = np.zeros(x_train.shape[0])
  
  b = 0
  
  C = 1
  
  p = np.zeros(x_train.shape[0])
  
  maxgen = 100
  
  def gramMat(x):
  
      v = []
  
      for i in x:
  
          for j in x:
  
              k = np.dot(i,j.T)
  
              v.append(k)
  
      gram = np.array(v).reshape(len(x),len(x))
  
      return gram
  
  K = gramMat(x_train)
  
  def selectFirstSample(K,y,p,alpha,b,C):
  
      threshold = 0.001
  
      c = y*p-1
  
      c1 = c.copy();c2=c.copy();c3=c.copy()
  
      c1[(alpha > 0) & (c >= 0)] = 0
  
      c2[((alpha==0) | (alpha==C)) & (c==0)] = 0
  
      c3[(alpha < 0) & (c www.tiaotiaoylzc.com/ <= 0)] = 0
  
      error = c1**2+c2**2+c3**2
  
      index = np.argmax(error)
  
      if error[index] >= threshold:
  
          return index
  
      else:
  
          return None
  
  def selectSecondSample(id1,y_train):
  
      id2 = np.random.randint(www.ysyl157.com len(y_train))
  
      while id1 == id2:
  
          id2 = np.random.randint(len(y_train))
  
      return id2
  
  def boundary(y,id1,id2,C):
  
      if y[id1] =www.xgll521.com= y[id2]:
  
          lb = max(0,alpha[id1]+alpha[id2]-C)
  
          ub = min(C,alpha[id1]+alpha[id2])
  
      else:
  
          lb = max(0,alpha[id2]-alpha[id1])
  
          ub = min(C,C+alpha[id2]-alpha[id1])
  
      return lb,ub
  
  def updateAlpha(K,y,p,id1,id2,lb,ub,C):
  
      old_alpha1 = alpha[id1];old_alpha2 = alpha[id2]
  
      p1 = p[id1];p2 = p[id2]
  
      y1 = y[id1];y2 = y[id2]
  
      E1 = p1 - y1;E2 = p2 - y2
  
      beta = 2*K[id1,id2] - K[id1,id1] - K[id2,id2]
  
      new_alpha2 = old_alpha2 - y2*(E1-E2)/beta
  
      if new_alpha2 > ub:
  
          new_alpha2 = ub
  
      if new_alpha2 < lb:
  
          new_alpha2 www.taohuaqing178.com= lb
  
      alpha[id2] = new_alpha2
  
      new_alpha1 = old_alpha1 - y1*y2*(new_alpha2 - old_alpha2)
  
      alpha[id1] = new_alpha1
  
      deta1 = new_alpha1 - old_alpha1
  
      deta2 = new_alpha2 - old_alpha2
  
      dw = [y1*deta1,y2*deta2]
  
      b1 = -E1 - y1*K[id1,id1]*deta1 - y2*K[id1,id2]*deta2
  
      b2 = -E2 - y1*K[id1,id2]*deta1 - y2*K[id2,id2]*deta2
  
      if new_alpha1 >=0 and new_alpha1 <= C:
  
          db = b1
  
      elif new_alpha2 >www.thd178.com/ =0 and new_alpha2 <= C:
  
          db = b2
  
      else:
  
          db = (b1 + b2)/2
  
      p = p + dw[0]*K[id1,:].T + dw[1]*K[id2,:].T + db
  
      return p
  
  for L in range(maxgen):
  
      id1 = selectFirstSample(K,y_train,p,alpha,b,C)
  
      id2 = selectSecondSample(id1,y_train)
  
      lb,ub = boundary(y_train,id1,id2,C)
  
      p = updateAlpha(K,y,p,id1,id2,lb,ub,C)
  
  index = np.argmax((alpha!=0)&(alpha!=C))
  
  b = y_train[index] - np.sum(alpha*y_train*K[:,index])
  
  predict_train = np.sign(np.sum(alpha*y_train*K,axis=0)+b)
  
  train_acc = len(np.where(predict_train==y_train)[0])/len(y_train)
  
  predict_test = []
  
  for arr in x_test:
  
      v = np.sum(alpha*y_train*np.dot(x_train,arr.T))+b
  
      predict_test.append(np.sign(v))   
  
  test_acc = len(np.where(predict_test==y_test)[0])/len(y_test)
  
  print('self-written ==> Train acc = ',round(train_acc,4),' Test acc = ',round(test_acc,4))
  
  model = SVC()
  
  model.fit(x_train,y_train)
  
  train_acc = model.score(x_train,y_train)
  
  test_acc = model.score(x_test,y_test)
  
  print('sklearn ==> Train acc = ',round(train_acc,4),' Test acc = ',round(test_acc,4))

机器学习模型-支持向量机(SVM)的更多相关文章

  1. 机器学习之支持向量机—SVM原理代码实现

    支持向量机—SVM原理代码实现 本文系作者原创,转载请注明出处:https://www.cnblogs.com/further-further-further/p/9596898.html 1. 解决 ...

  2. 机器学习:支持向量机(SVM)

    SVM,称为支持向量机,曾经一度是应用最广泛的模型,它有很好的数学基础和理论基础,但是它的数学基础却比以前讲过的那些学习模型复杂很多,我一直认为它是最难推导,比神经网络的BP算法还要难懂,要想完全懂这 ...

  3. 机器学习算法 - 支持向量机SVM

    在上两节中,我们讲解了机器学习的决策树和k-近邻算法,本节我们讲解另外一种分类算法:支持向量机SVM. SVM是迄今为止最好使用的分类器之一,它可以不加修改即可直接使用,从而得到低错误率的结果. [案 ...

  4. 【机器学习】支持向量机SVM

    关于支持向量机SVM,这里也只是简单地作个要点梳理,尤其是要注意的是SVM的SMO优化算法.核函数的选择以及参数调整.在此不作过多阐述,单从应用层面来讲,重点在于如何使用libsvm,但对其原理算法要 ...

  5. python机器学习之支持向量机SVM

    支持向量机SVM(Support Vector Machine) 关注公众号"轻松学编程"了解更多. [关键词]支持向量,最大几何间隔,拉格朗日乘子法 一.支持向量机的原理 Sup ...

  6. 机器学习(十一) 支持向量机 SVM(上)

    一.什么是支撑向量机SVM (Support Vector Machine) SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法.在机器学习领域,是一个有监督 ...

  7. 机器学习-5 支持向量机SVM

    一.概念和背景 SVM:Support Vector Machine 支持向量机. 最早是由Vladimir N. Vapnik和Alexey Ya. Chervonenkis在1963年提出的. 目 ...

  8. 机器学习(十一) 支持向量机 SVM(下)

    支持向量机通过某非线性变换 φ( x) ,将输入空间映射到高维特征空间.特征空间的维数可能非常高.如果支持向量机的求解只用到内积运算,而在低维输入空间又存在某个函数 K(x, x′) ,它恰好等于在高 ...

  9. 吴裕雄--天生自然python机器学习:支持向量机SVM

    基于最大间隔分隔数据 import matplotlib import matplotlib.pyplot as plt from numpy import * xcord0 = [] ycord0 ...

随机推荐

  1. 前端pc版的简单适配

    我们都知道对于前端pc版本的适配是一个难题,大部分都是做的媒体查询.但是有时间公司不要媒体查询 就是需要不管多大的屏幕都是满屏显示.我就在考虑为啥不用rem给pc端做个适配. 我是基于设计图是1920 ...

  2. Idea 2017 激活方法

    http://www.cnblogs.com/suiyueqiannian/p/6754091.html

  3. ruby 数据类型Symbol

    一.符号创建 符号是Symbol类的实例,使用冒号加一个标识符即可创建符号 :a :"This is a symno" 二.符号字符串相互转换 p :symbol.to_s #=& ...

  4. HDU暑假多校第八场J-Taotao Picks Apples

    一.题意 给定一个序列,之后给出若干个修改,修改的内容为在原序列的基础上,将某一位元素的值改成给定的值<每次修改相互独立,不保存修改后的结果>.之后询问,在选择第一位元素的情况下,最长递增 ...

  5. CC3200在sl_Start函数处不断重启复位的原因解析

    1. 使用过程中,自己写的工程,发现CC3200一直重启,首先需要定位出现重启的函数?看门狗复位,还是程序跑飞复位?NWP的版本不匹配?经过测试找到出问题的函数,这个函数是启动网络的函数. lRetV ...

  6. C#获取网络图片

    简单获取图片 string url = zhi_txt.Text;//图片地址 string dizhi = lujing.Text;//图片下载后保存路径及图片名称要写在一块 WebClient w ...

  7. 剖析DI

    0x00.前言 当我们研究一些晦涩的源码,上网查阅资料的时候,映入眼帘的总有这么些名词:DIP.IOC.DI.DL.IOC容器这些专业名词.如果不懂这些名词背后的含义,我们内心有可能是这样的: 0x0 ...

  8. 不得不服!Python速度虽然慢,但是它工作效率很高!

    写在前面 让我们来讨论一个我最近一直在思考的问题:Python 的性能.顺便说一下,我是 Python 的忠实拥趸,我在各种情况下都会积极尝试使用 Python 来解决问题.大家对 Python 最大 ...

  9. Kubernetes集群(概念篇)

    Kubernetes介绍 2013年docker诞生,自此一发不可收拾,它的发展如火如荼,作为一个运维如果不会docker,那真的是落伍了. 而2014年出现的kubernetes(又叫k8s)更加炙 ...

  10. Leetcode 54. Spiral Matrix & 59. Spiral Matrix II

    54. Spiral Matrix [Medium] Description Given a matrix of m x n elements (m rows, n columns), return ...