Python3 反向传播神经网络-Min-Batch(根据吴恩达课程讲解编写)

 # -*- coding: utf-8 -*-

 """

 Created on Sat Jan 20 13:47:54 2018

 @author: markli

 """

 import numpy as np;

 import random;

 def tanh(x):

     return np.tanh(x);

 def tanh_derivative(x):

     return 1.0 - np.tanh(x)*np.tanh(x);

 def logistic(x):

     return 1/(1 + np.exp(-x));

 def logistic_derivative(x):

     return logistic(x)*(1-logistic(x));

 def ReLU(x,a=1):

     return max(0,a * x);

 def ReLU_derivative(x,a=1):

     return 0 if x < 0 else a;

 class NeuralNetwork:

     '''

     Z = W * x + b

     A = sigmod(Z)

     Z 净输入

     x 样本集合 m * n n 个特征 m 个样本数量

     b 偏移量

     W 权重

     A 净输出

     '''

     def __init__(self,layers,active_function=[logistic],active_function_der=[logistic_derivative],learn_rate=0.9):

         self.weights = [2*np.random.randn(x,y)-1 for x,y in zip(layers[1:],layers[:-1])]; #weight 取值范围（-1,1）

         self.B = [2*np.random.randn(x,1)-1 for x in layers[1:]]; #b 取值范围（-1,1）

         self.learnRate = learn_rate;

         self.size = len(layers);

         self.sigmoids = [];

         self.sigmoids_der = [];

         for i in range(len(layers)-1):

             if(len(active_function) == self.size-1):

                 self.sigmoids = active_function;

             else:

                 self.sigmoids.append(active_function[0]);

             if(len(active_function_der)== self.size-1):

                 self.sigmoids_der = active_function_der;

             else:

                 self.sigmoids_der.append(active_function_der[0]);

     '''后向传播算法'''

     def BackPropgation(self,X,Y):

         """

         X size*n 维，size大小为Mini_Batch_size 值大小,n 个特征

         Y size*l 维，size大小为Mini_Batch_sieze 值大小，l 个类标签

         一次计算size个样本带来的w,b的变化量

         """

         deltb = [np.zeros(b.shape) for b in self.B];

         deltw = [np.zeros(w.shape) for w in self.weights];

         active = np.transpose(X);

         actives = [active];

         zs = [];

         i=0;

         #前向传播

         for w,b in zip(self.weights,self.B):

             z = np.dot(w,active) + b;

             zs.append(z);

             active = self.sigmoids[i](z);

             actives.append(active);

             i = i+1;

         Y = np.transpose(Y); #转置

         cost = self.cost(actives[-1], Y) #成本函数 计算对a的一阶导数

         z = zs[-1];

         delta = np.multiply(cost,self.sigmoids_der[-1](z)); #计算输出层(最后一层)的变化量

         deltb[-1] = np.sum(delta,axis=1,keepdims=True); #计算输出层(最后一层)b的size次累计变化量 l*1 维

         deltw[-1] = np.dot(delta, np.transpose(actives[-2]));#计算输出层(最后一层)w的size次累计变化量 x*l 维

         for i in range(2,self.size):

             z = zs[-i]; #当前层的z值

             sp = self.sigmoids_der[-i](z); #对z的偏导数值

             delta = np.multiply(np.dot(np.transpose(self.weights[-i+1]), delta), sp); #求出当前层的误差

             #deltb = delta;

             deltb[-i] = np.sum(delta,axis=1,keepdims=True); #当前层b的size次累计变化量 l*1 维

             deltw[-i] = np.dot(delta, np.transpose(actives[-i-1])); # 当前层w的size次累计变化量 x*l

         return deltw,deltb;

     def fit(self,X,Y,mini_batch_size,epochs=1000):

         N = len(Y);

         for i in range(epochs):

             randomlist = np.random.randint(0,N-mini_batch_size,int(N/mini_batch_size));

             batch_X = [X[k:k+mini_batch_size] for k in randomlist];

             batch_Y = [Y[k:k+mini_batch_size] for k in randomlist];

             for m in range(len(batch_Y)):

                 deltw,deltb = self.BackPropgation(batch_X[m],batch_Y[m]);

                 self.weights = [w - (self.learnRate / mini_batch_size) * dw for w,dw in zip(self.weights,deltw)];

                 self.B = [b - (self.learnRate / mini_batch_size) * db for b,db in zip(self.B,deltb)];

 #        path = sys.path[0];

 #        with open(path,'w',encoding='utf8') as f:

 #            for j in range(len(self.weights)-1):

 #                f.write(self.weights[j+1]);

 #                f.write(self.activeFunction[j+1]);

 #                f.write(self.activeFunctionDer[j+1]);

 #        f.close();

     def predict(self,x):

         """前向传播"""

         i = 0;

         for b, w in zip(self.B, self.weights):

             x = self.sigmoids[i](np.dot(w, x)+b);

             i = i + 1;

         return x

     def cost(self,a,y):

         """

         损失函数对z的偏导数的除输出层对z的导数的因子部分

         完整表达式 为 （a - y）* sigmod_derivative(z)

         由于此处不知道输出层的激活函数故不写出来，在具体调用位置加上

         """

         return a-y;

该算法按照吴恩达先生讲述的BP神经网络算法编写，实现了一次进行Mini_Batch_size 次的训练。下面给出测试代码和测试结果。

 import numpy as np

 from sklearn.datasets import load_digits

 from sklearn.metrics import confusion_matrix, classification_report

 from sklearn.preprocessing import LabelBinarizer

 from FullNeuralNetwork import  NeuralNetwork

 from sklearn.cross_validation import train_test_split

 digits = load_digits();

 X = digits.data;

 y = digits.target;

 X -= X.min(); # normalize the values to bring them into the range 0-1

 X /= X.max();

 nn = NeuralNetwork([64,100,10]);

 X_train, X_test, y_train, y_test = train_test_split(X, y);

 labels_train = LabelBinarizer().fit_transform(y_train);

 labels_test = LabelBinarizer().fit_transform(y_test);

 # X_train.shape (1347,64)

 #y_train.shape(1347)

 #labels_train.shape (1347,10)

 #labels_test.shape(450,10)

 print ("start fitting");

 #print(Data);

 nn.fit(X_train,labels_train,epochs=500,mini_batch_size=8);

 result = nn.predict(X_test.T);

 predictions = [np.argmax(result[:,y]) for y in range(result.shape[1])];

 print(predictions);

 #for i in range(result.shape[1]):

 #    y = result[:,i];

 #    predictions.append(np.argmax(y));

 ##print(np.atleast_2d(predictions).shape);

 print (confusion_matrix(y_test,predictions));

 print (classification_report(y_test,predictions));

测试结果：

总体效果还可以，需要调一调其中的参数。之前发布的代码我后来仔细看了一下，发现算法有误，现在改正过来了。基本没什么错误了，哈哈哈。

Python3 反向传播神经网络-Min-Batch(根据吴恩达课程讲解编写)的更多相关文章

【吴恩达课程使用】anaconda (python 3.7) win10安装 tensorflow 1.8 cpu版
[吴恩达课程使用]anaconda (python 3.7) win10安装 tensorflow 1.8 目前tensorflow是只支持到python3.6的,anaconda最新版本已经到pyt ...
【吴恩达课程使用】pip安装pandas失败-anaconda各种玄学T-T-从新开始搭建环境
[吴恩达课程使用]安装pandas失败-从新开始搭建环境在第五课第二周的任务2中,虚拟环境缺少pandas,sklearn依赖,因为用pip比较顺手,就直接使用pip安装,结果各种anaconda环 ...
【吴恩达课程使用】keras cpu版安装【接】- anaconda (python 3.7) win10安装 tensorflow 1.8 cpu版
一.确认tensorflow的版本: 接上一条tensorflow的安装,注意版本不匹配会出现很多问题!:[吴恩达课程使用]anaconda (python 3.7) win10安装 tensorfl ...
【CNN】吴恩达课程中几种网络的比较
LeNet5 AlexNet VGG16 ResNet : 残差网络 Inception Net : 特点,可以通过1*1*192 的卷积核来缩减参数个数,压缩维度,约缩减10倍, 例如 :用1 ...
吴恩达深度学习反向传播（Back Propagation）公式推导技巧
由于之前看的深度学习的知识都比较零散,补一下吴老师的课程希望能对这块有一个比较完整的认识.课程分为5个部分(粗体部分为已经看过的): 神经网络和深度学习改善深层神经网络:超参数调试.正则化以及优化 ...
用纯Python实现循环神经网络RNN向前传播过程(吴恩达DeepLearning.ai作业)
Google TensorFlow程序员点赞的文章! 前言目录: - 向量表示以及它的维度 - rnn cell - rnn 向前传播重点关注: - 如何把数据向量化的,它们的维度是怎么来的 ...
吴恩达深度学习第1课第4周-任意层人工神经网络(Artificial Neural Network，即ANN)（向量化）手写推导过程（我觉得已经很详细了）
学习了吴恩达老师深度学习工程师第一门课,受益匪浅,尤其是吴老师所用的符号系统,准确且易区分．遵循吴老师的符号系统,我对任意层神经网络模型进行了详细的推导,形成笔记．有人说推导任意层MLP很容易,我 ...
吴恩达deepLearning.ai循环神经网络RNN学习笔记_看图就懂了！！！(理论篇)
前言目录: RNN提出的背景 - 一个问题 - 为什么不用标准神经网络 - RNN模型怎么解决这个问题 - RNN模型适用的数据特征 - RNN几种类型 RNN模型结构 - RNN block - ...
吴恩达deepLearning.ai循环神经网络RNN学习笔记_没有复杂数学公式，看图就懂了！！！(理论篇)
本篇文章被Google中国社区组织人转发,评价: 条理清晰,写的很详细! 被阿里算法工程师点在看! 所以很值得一看! 前言目录: RNN提出的背景 - 一个问题 - 为什么不用标准神经网络 - RN ...

随机推荐

jQuery获取radio选中后的文字
原文链接:http://blog.csdn.net/zhanyouwen/article/details/51393216 jQuery获取radio选中后的文字转载 2016年05月13日 10:3 ...
IO之间的比较
在高性能的IO体系设计中,有几个名词概念常常会使我们感到迷惑不解.具体如下: 序号问题 1 什么是同步? 2 什么是异步? 3 什么是阻塞? 4 什么是非阻塞? 5 什么是同步阻塞? 6 什么是同步 ...
webpack全局引入库
我们在日常开发的时候会遇到一些每个页面都可能会引用到的库(例如jquery) 这可能会导致我们在每一个页面都需要写这样一个语句: import $ from 'jquery'; 可能有人会担心,最后打 ...
Hadoop基础-MapReduce的数据倾斜解决方案
Hadoop基础-MapReduce的数据倾斜解决方案作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.数据倾斜简介 1>.什么是数据倾斜答:大量数据涌入到某一节点,导致 ...
cookie添加删除修改
//cookie添加 document.cookie="username=John Doe"; //添加过期时间 document.cookie="username1=J ...
bzoj千题计划184：bzoj1261: [SCOI2006]zh_tree
http://www.lydsy.com/JudgeOnline/problem.php?id=1261 dp[l][r][dep] 区间[l,r]内的节点,根在dep层的最小代价枚举根i,dp[ ...
数学：莫比乌斯反演-GCD计数
Luogu3455:莫比乌斯反演进行GCD计数莫比乌斯反演就是用来解决这一类问题的,通常f函数是要求的那个,F函数是显然的这样利用F的结果就可以推出来f的结果在计算结果的时候整除分快儿一下就可以 ...
ngx_lua_API 指令详解（二）ngx.re.match/find/gmatch/sub/gsub指令集合
1.先来个官方的ngx.re.match location /ngx_re_match { default_type text/html; content_by_lua_block { local m ...
【原创】backbone1.1.0源码解析之Events
最近在看些node的源代码,发现backbone的应用还是挺广泛的,但是之前的学习忘得一干二净了,后悔当时没做笔记啊. 所以,无奈想用的更好,就是得把源代码看楚,所以还是把源代码的注释笔记留下来,供自 ...
html5 canvas结构基础
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

Python3 反向传播神经网络-Min-Batch(根据吴恩达课程讲解编写)

Python3 反向传播神经网络-Min-Batch(根据吴恩达课程讲解编写)的更多相关文章

随机推荐

热门专题