【Python 代码】CS231n中Softmax线性分类器、非线性分类器对比举例（含python绘图显示结果）

  1 #CS231n中线性、非线性分类器举例（Softmax）

 #注意其中反向传播的计算

 # -*- coding: utf-8 -*-

 import numpy as np

 import matplotlib.pyplot as plt

 N = 100 # number of points per class

 D = 2 # dimensionality

 K = 3 # number of classes

 X = np.zeros((N*K,D)) # data matrix (each row = single example)

 y = np.zeros(N*K, dtype='uint8') # class labels

 for j in xrange(K):

   ix = range(N*j,N*(j+1))

   r = np.linspace(0.0,1,N) # radius

   t = np.linspace(j*4,(j+1)*4,N) + np.random.randn(N)*0.2 # theta

   X[ix] = np.c_[r*np.sin(t), r*np.cos(t)]

   y[ix] = j

 # lets visualize the data:

 plt.xlim([-1, 1])

 plt.ylim([-1, 1])

 plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)

 plt.show()

 # initialize parameters randomly

 # 线性分类器

 W = 0.01 * np.random.randn(D,K)

 b = np.zeros((1,K))

 # some hyperparameters

 step_size = 1e-0

 reg = 1e-3 # regularization strength

 # gradient descent loop

 num_examples = X.shape[0]

 for i in xrange(200):

   # evaluate class scores, [N x K]

   scores = np.dot(X, W) + b 

   # compute the class probabilities

   exp_scores = np.exp(scores)

   probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True) # [N x K]

   # compute the loss: average cross-entropy loss and regularization

   corect_logprobs = -np.log(probs[range(num_examples),y])

   data_loss = np.sum(corect_logprobs)/num_examples

   reg_loss = 0.5*reg*np.sum(W*W)

   loss = data_loss + reg_loss

   if i % 10 == 0:

     print "iteration %d: loss %f" % (i, loss)

   # compute the gradient on scores

   dscores = probs

   dscores[range(num_examples),y] -= 1

   dscores /= num_examples

   # backpropate the gradient to the parameters (W,b)

   dW = np.dot(X.T, dscores)

   db = np.sum(dscores, axis=0, keepdims=True)

   dW += reg*W # regularization gradient

   # perform a parameter update

   W += -step_size * dW

   b += -step_size * db

   # evaluate training set accuracy

 scores = np.dot(X, W) + b

 predicted_class = np.argmax(scores, axis=1)

 print 'training accuracy: %.2f' % (np.mean(predicted_class == y))

 # plot the resulting classifier

 h = 0.02

 x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1

 y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

 xx, yy = np.meshgrid(np.arange(x_min, x_max, h),

                      np.arange(y_min, y_max, h))

 Z = np.dot(np.c_[xx.ravel(), yy.ravel()], W) + b

 Z = np.argmax(Z, axis=1)

 Z = Z.reshape(xx.shape)

 fig = plt.figure()

 plt.contourf(xx, yy, Z, cmap=plt.cm.Spectral, alpha=0.8)

 plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)

 plt.xlim(xx.min(), xx.max())

 plt.ylim(yy.min(), yy.max())

 ## initialize parameters randomly

 #  含一个隐层的非线性分类器 使用ReLU

 h = 100 # size of hidden layer

 W = 0.01 * np.random.randn(D,h)

 b = np.zeros((1,h))

 W2 = 0.01 * np.random.randn(h,K)

 b2 = np.zeros((1,K))

 # some hyperparameters

 step_size = 1e-0

 reg = 1e-3 # regularization strength

 # gradient descent loop

 num_examples = X.shape[0]

 for i in xrange(10000):

   # evaluate class scores, [N x K]

   hidden_layer = np.maximum(0, np.dot(X, W) + b) # note, ReLU activation

   scores = np.dot(hidden_layer, W2) + b2

   # compute the class probabilities

   exp_scores = np.exp(scores)

   probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True) # [N x K]

   # compute the loss: average cross-entropy loss and regularization

   corect_logprobs = -np.log(probs[range(num_examples),y])

   data_loss = np.sum(corect_logprobs)/num_examples

   reg_loss = 0.5*reg*np.sum(W*W) + 0.5*reg*np.sum(W2*W2)

   loss = data_loss + reg_loss

   if i % 1000 == 0:

     print "iteration %d: loss %f" % (i, loss)

   # compute the gradient on scores

   dscores = probs

   dscores[range(num_examples),y] -= 1

   dscores /= num_examples

   # backpropate the gradient to the parameters

   # first backprop into parameters W2 and b2

   dW2 = np.dot(hidden_layer.T, dscores)

   db2 = np.sum(dscores, axis=0, keepdims=True)

   # next backprop into hidden layer

   dhidden = np.dot(dscores, W2.T)

   # backprop the ReLU non-linearity

   dhidden[hidden_layer <= 0] = 0

   # finally into W,b

   dW = np.dot(X.T, dhidden)

   db = np.sum(dhidden, axis=0, keepdims=True)

   # add regularization gradient contribution

   dW2 += reg * W2

   dW += reg * W

   # perform a parameter update

   W += -step_size * dW

   b += -step_size * db

   W2 += -step_size * dW2

   b2 += -step_size * db2

 # evaluate training set accuracy

 hidden_layer = np.maximum(0, np.dot(X, W) + b)

 scores = np.dot(hidden_layer, W2) + b2

 predicted_class = np.argmax(scores, axis=1)

 print 'training accuracy: %.2f' % (np.mean(predicted_class == y))

 # plot the resulting classifier

 h = 0.02

 x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1

 y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

 xx, yy = np.meshgrid(np.arange(x_min, x_max, h),

                      np.arange(y_min, y_max, h))

 Z = np.dot(np.maximum(0, np.dot(np.c_[xx.ravel(), yy.ravel()], W) + b), W2) + b2

 Z = np.argmax(Z, axis=1)

 Z = Z.reshape(xx.shape)

 fig = plt.figure()

 plt.contourf(xx, yy, Z, cmap=plt.cm.Spectral, alpha=0.8)

 plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)

 plt.xlim(xx.min(), xx.max())

 plt.ylim(yy.min(), yy.max())

运行结果

【Python 代码】CS231n中Softmax线性分类器、非线性分类器对比举例（含python绘图显示结果）的更多相关文章

Python代码样例列表
扫描左上角二维码,关注公众账号数字货币量化投资,回复“1279”,获取以下600个Python经典例子源码 ├─algorithm│ Python用户推荐系统曼哈顿算法实现.py│ ...
ROS系统python代码测试之rostest
ROS系统中提供了测试框架,可以实现python/c++代码的单元测试,python和C++通过不同的方式实现, 之后的两篇文档分别详细介绍各自的实现步骤,以及测试结果和覆盖率的获取. ROS系统中p ...
[转] Python 代码性能优化技巧
选择了脚本语言就要忍受其速度,这句话在某种程度上说明了 python 作为脚本的一个不足之处,那就是执行效率和性能不够理想,特别是在 performance 较差的机器上,因此有必要进行一定的代码优化 ...
Python代码性能优化技巧
摘要:代码优化能够让程序运行更快,可以提高程序的执行效率等,对于一名软件开发人员来说,如何优化代码,从哪里入手进行优化?这些都是他们十分关心的问题.本文着重讲了如何优化Python代码,看完一定会让你 ...
Python 代码性能优化技巧（转）
原文:Python 代码性能优化技巧 Python 代码优化常见技巧代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构.优化. ...
Python 代码性能优化技巧
选择了脚本语言就要忍受其速度,这句话在某种程度上说明了 python 作为脚本的一个不足之处,那就是执行效率和性能不够理想,特别是在 performance 较差的机器上,因此有必要进行一定的代码优化 ...
利用Python代码编写计算器小程序
import tkinter import tkinter.messagebox import math class JSQ: def __init__(self): #创建主界面 self.root ...
python 代码检测工具
对于我这种习惯了 Java 这种编译型语言,在使用 Python 这种动态语言的时候,发现错误经常只能在执行的时候发现,总感觉有点不放心. 而且有一些错误由于隐藏的比较深,只有特定逻辑才会触发,往往导 ...
随机森林入门攻略（内含R、Python代码）
随机森林入门攻略(内含R.Python代码) 简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获 ...

随机推荐

img中alt和title属性的区别
在图像标签img中,除了常用的宽度width和高度height属性之外,还有两个比较重要并且也会用到的属性,就是alt和title,这都是用来显示图片内容的具体信息的,但是这两个属性也有不同的地方.a ...
STM32F10x芯片类型 STM32F10X_LD STM32F10X_MD STM32F10X_HD STM32F10X_XL STM32F10X_CL
stm32f10x.h 固件库stm32f10x.h中有如下解释 #if !defined (STM32F10X_LD) && !defined (STM32F10X_LD_VL) & ...
linq 书籍推荐博客汇总（经典）
1.博客推荐博客园linq专区 https://kb.cnblogs.com/zt/linq/ LINQ体验系列文章导航 https://www.cnblogs.com/lyj/archive/20 ...
java线程的生命周期及五种基本状态
一.线程的生命周期及五种基本状态关于Java中线程的生命周期,首先看一下下面这张较为经典的图: 上图中基本上囊括了Java中多线程各重要知识点.掌握了上图中的各知识点,Java中的多线程也就基本上掌 ...
【MySQL】SQL语句基础
一.操作数据库 1.1 创建数据库 1.2 查看数据库 1.3 修改数据库 1.4 删除数据库 1.5 选择数据库二.操作表 2.1 创建表 2.2 查看表 2.3 修改表 2.4 删除表三.操作 ...
快速为不同 Git 平台配置用户
在 ~ 目录下创建 config 文件可以为项目配置默认的用户信息,但如果希望经常切换,那么最好就是通过命令为项目单独设置用户. 我使用的 shell 是 zsh, 所以我在 ~/.zshrc 文件中 ...
dockerfile命令说明及使用
执行Dockerfile命令: docker build -f /path/to/a/Dockerfil Dockerfile的基本结构 Dockerfile 一般分为四部分:基础镜像信息.维护者信息 ...
c# Directory类的常用方法
[daily] ssh通过私钥导出公钥
在使用key方式登录ssh服务的时候,我们知道ssh key是使用公钥ssh-keygen工具生成的. 有时候,我们只保存了私钥,但是并没有保存公钥.这个时候,可以使用如下方法, 从私钥中将公钥导 ...
[ipsec][strongswan] 使用VTI配置基于路由的ipsec
之前写的一个:[dev][ipsec] 基于路由的VPrivateN 一我们默认用strongswan的时候基于策略的. 也就是policy. 基于策略的ipsec中, policy承担了两部分功能 ...

【Python 代码】CS231n中Softmax线性分类器、非线性分类器对比举例（含python绘图显示结果）

【Python 代码】CS231n中Softmax线性分类器、非线性分类器对比举例（含python绘图显示结果）的更多相关文章

随机推荐

热门专题