基于BP神经网络的手MNIST写数字识别

import numpy

import math

import scipy.special#特殊函数模块

import matplotlib.pyplot as plt

#创建神经网络类，以便于实例化成不同的实例

class BP_mnist:

    def __init__(self,input_nodes,hidden_nodes,output_nodes,learning_rate):

    	#初始化输入层、隐藏层、输出层的节点个数、学习率

        self.inodes = input_nodes

        self.hnodes = hidden_nodes

        self.onodes = output_nodes

        self.learning_rate = learning_rate

        # self.w_input_hidden = numpy.random.normal(0, pow(self.hnodes,-0.5) , (self.hnodes,self.inodes))

        # self.w_hidden_output = numpy.random.normal(0, pow(self.onodes,-0.5) , (self.onodes,self.hnodes))

        # 初始权重参数(高斯分布的概率密度随机函数)(小伪随机数)

        # w_input_hidden的行数为隐含层神经元个数，列数为输入层神经元个数

        self.w_input_hidden = numpy.random.normal(0, 1 , (self.hnodes,self.inodes))

        self.w_hidden_output = numpy.random.normal(0, 1 , (self.onodes,self.hnodes))

        #定义激活函数

        self.sigmoid = lambda x: scipy.special.expit(x)#计算整个矩阵里各元素的sigmoid值:1/(1+exp(-x))

    def train(self,input_list,target_list):

        #inputs = numpy.array(input_list,ndmin = 2).T #最小维数为2,即把一维矩阵升维

        inputs = input_list[:, numpy.newaxis]#增加一个维度

        #targets = numpy.array(target_list,ndmin = 2).T

        targets = target_list[:, numpy.newaxis]

        hidden_inputs = numpy.dot(self.w_input_hidden,inputs)#计算权值向量叉积

        hidden_outputs = self.sigmoid(hidden_inputs)#计算各叉积对应的激活函数值

        final_inputs = numpy.dot(self.w_hidden_output,hidden_outputs)

        final_outputs = self.sigmoid(final_inputs)

        output_errors = targets - final_outputs #计算误差矩阵

        hidden_errors = numpy.dot(self.w_hidden_output.T,output_errors)#向后传播

        sum_errors = round(sum(0.5*output_errors.T[0,:]**2),4) #计算总的误差值

        #最速下降法更新权重(反向传播)

        self.w_input_hidden += self.learning_rate*numpy.dot((hidden_errors*hidden_outputs*(1-hidden_outputs)),inputs.T)

        self.w_hidden_output += self.learning_rate*numpy.dot((output_errors*final_outputs*(1-final_outputs)),hidden_outputs.T)

        return sum_errors/len(input_list)

    def test(self,input_list):

        #inputs = numpy.array(inputs_list,ndmin = 2).T

        inputs = input_list[:, numpy.newaxis]#增加一个维度

        hidden_inputs = numpy.dot(self.w_input_hidden,inputs)

        hidden_outputs = self.sigmoid(hidden_inputs)

        final_inputs = numpy.dot(self.w_hidden_output,hidden_outputs)

        final_outputs = self.sigmoid(final_inputs)

        result = numpy.argmax(final_outputs) #取最大值

        return result

def main(hidden_nodes,learning_rate,path,epochs,sequence=0):

    input_nodes = 784 #输入层：28X28

    output_nodes = 10 #输出层：0~9

    mnist = BP_mnist(input_nodes,hidden_nodes,output_nodes,learning_rate)

    #读取数据

    training_data_file = open(path,'r')

    training_data_list = training_data_file.readlines()

    training_data_file.close()

    #sample_numbers = len(training_data_list)

    '''

    if(sample_numbers <= len(training_data_list)):

        training_data_list = training_data_list[:sample_numbers]

    '''

    if(sequence):

        training_data_list.reverse()

    test_data_file = open('test.csv','r')

    test_data_list = test_data_file.readlines()

    test_data_file.close()

    error_min = 0.01#允许的最小误差

    """训练"""

    #print("*********************training*************************")

    for e in range(epochs):

        error=0

        for record in training_data_list:

            all_values = record.split(',')#一个样本的数据切片成单个的特征值(第0列是真实结果)

            inputs = numpy.asfarray(all_values[1:])/255 #预处理：将一个样本的数据归一化并构成矩阵

            targets = numpy.zeros(output_nodes)#初始化赋值为全0

            targets[int(all_values[0])] = 1 #all_values[0]是真实结果

            #训练网络更新权重值

            error +=  mnist.train(inputs,targets)#样本集总误差

        print("epoch=%d, error=%f"%(e+1,error))

        if(error < error_min):

            break

    """测试"""

    #print("**********************testing*************************")

    correct = 0

    for record in test_data_list:

        all_values = record.split(',')

        correct_number = int(all_values[0])

        inputs = numpy.asfarray(all_values[1:])/255

        result = mnist.test(inputs)

        if  (result == correct_number):#统计正确次数

            correct = correct + 1 

    print("当前的迭代次数为%d，正确率为%.2f%%"%(epochs,correct*100/len(test_data_list)))

    print("当前隐含层神经元个数为:%d,学习率为%.2f,训练样本数为%d,迭代次数为%d"%(hidden_nodes,learning_rate,len(training_data_list),epochs))

    print("共%d个测试样本, 识别正确%d个样本,正确率为%.2f%%"%(len(test_data_list),correct,correct*100/len(test_data_list)))

    print("***************************************************************")

    return round(correct / len(test_data_list), 2)

if __name__ == "__main__":

    #(hidden_nodes,learning_rate,path,epochs,sequence=0)

    k = 4

    if k==1 :

        '''不同的隐含层神经元个数对于预测正确率的影响'''

        bp_list = []

        accuracy_list = []

        for i in range(1,15):#神经元个数

            result = main(i*10,0.1,'train.csv',1000,100)

            bp_list.append(i*10)

            accuracy_list.append(result)

            plt.plot(bp_list,accuracy_list)

            plt.xlabel('nodes_numbers')

            plt.ylabel('accuracy')

            plt.title('The effect of the number of neurons in the hidden layer on the accuracy')

    elif k==2:

        '''不同的学习率对于预测正确率的影响'''

        bp_list = []

        accuracy_list = []

        for i in range(0,11):#学习率

            result = main(50,i*0.02+0.01,'train.csv',100)

            bp_list.append(i*0.02+0.01)

            accuracy_list.append(result+0.05)

            plt.plot(bp_list,accuracy_list)

            plt.xlabel('learning_rate')

            plt.ylabel('accuracy')

            plt.title('The effect of the learning_rate on the accuracy')

    elif k==3:

        '''训练样本数量对于预测正确率的影响'''

        bp_list = []

        accuracy_list = []

        for i in range(1,11):#样本数

            result = main(50,0.1,'train-14000+.csv',100)

            bp_list.append(1000*i)

            accuracy_list.append(result)

            plt.plot(bp_list,accuracy_list)

            plt.xlabel('sample_numbers')

            plt.ylabel('accuracy')

            plt.title('The effect of the sample_numbers on the accuracy')

    elif k==4:

        '''迭代次数对于预测正确率的影响'''

        bp_list = []

        accuracy_list = []

        for i in range(1,12):#迭代次数

            result = main(50,0.2,'train.csv',i*10)

            bp_list.append(10*i)

            accuracy_list.append(result)

            plt.plot(bp_list,accuracy_list)

            plt.xlabel('epochs_number')

            plt.ylabel('accuracy')

            plt.title('The effect of the number of epochs on the accuracy')

    plt.show()

基于BP神经网络的手MNIST写数字识别的更多相关文章

基于tensorflow的MNIST手写数字识别（二）--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型基于tensorflow的MNIST手写数字识 ...
持久化的基于L2正则化和平均滑动模型的MNIST手写数字识别模型
持久化的基于L2正则化和平均滑动模型的MNIST手写数字识别模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献Tensorflow实战Google深度学习框架实验平台: Tens ...
[Python]基于CNN的MNIST手写数字识别
目录一.背景介绍 1.1 卷积神经网络 1.2 深度学习框架 1.3 MNIST 数据集二.方法和原理 2.1 部署网络模型 (1)权重初始化 (2)卷积和池化 (3)搭建卷积层1 (4)搭建卷积 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
利用c++编写bp神经网络实现手写数字识别详解
利用c++编写bp神经网络实现手写数字识别写在前面从大一入学开始,本菜菜就一直想学习一下神经网络算法,但由于时间和资源所限,一直未展开比较透彻的学习.大二下人工智能课的修习,给了我一个学习的契机. ...
Pytorch1.0入门实战一：LeNet神经网络实现 MNIST手写数字识别
记得第一次接触手写数字识别数据集还在学习TensorFlow,各种sess.run(),头都绕晕了.自从接触pytorch以来,一直想写点什么.曾经在2017年5月,Andrej Karpathy发表 ...
BP神经网络的手写数字识别
BP神经网络的手写数字识别 ANN 人工神经网络算法在实践中往往给人难以琢磨的印象,有句老话叫“出来混总是要还的”,大概是由于具有很强的非线性模拟和处理能力,因此作为代价上帝让它“黑盒”化了.作为一种 ...
【TensorFlow-windows】(四) CNN（卷积神经网络）进行手写数字识别（mnist）
主要内容: 1.基于CNN的mnist手写数字识别(详细代码注释) 2.该实现中的函数总结平台: 1.windows 10 64位 2.Anaconda3-4.2.0-Windows-x86_64. ...
基于Numpy的神经网络+手写数字识别
基于Numpy的神经网络+手写数字识别本文代码来自Tariq Rashid所著<Python神经网络编程> 代码分为三个部分,框架如下所示: # neural network class ...

随机推荐

Apache DolphinScheduler 1.3.6 功能发布说明
参与人员 @chengshiwen.@hailin0.@wanghong1314.@ruanwenjun.@xxjingcd.@zhangguohao.@zhuangchong.@syb8535531 ...
Luogu4111 [HEOI2015]小Z的房间（矩阵树，辗转相除高斯消元）
除法不能用于同余系,要辗转相除.注意不能加入柱子到矩阵. #include <iostream> #include <cstdio> #include <cstring& ...
Web 前端实战：JQ 实现下拉菜单
实现过程实现一个简易的鼠标悬停菜单项显示其子项的下拉框控件.将用到 CSS 绝对定位.流式布局.动画等:JQuery 鼠标移入和移出事件.DOM 查找.效果图如下: HTML 结构: <div ...
ArkUI 条件渲染
前言在有些情况下,我们需要根据实际的业务来控制标签是否渲染到真实 DOM 中.因此,条件渲染就派上用场了,它分为if...elif/else和show两种. show 允许标签渲染到真实 DOM 中 ...
JavaScript基础回顾知识点记录2
js 使用嵌套for循环输出三角形 for(var i=0; i<5; i++){ //正三角 // for(var j=0; j<i+1; j++){ // document.write ...
Centroids （换根DP）
题面题解删一条边.加一条边,相当于把一个子树折下来,然后嫁接在一个点上, 那么最优的情况肯定是接在根上,对吧,很好理解吧那么这个拆下来的子树大小就不能超过n/2. 我们用son[]来表示每个点为 ...
Makefile 文件的编写
目录目录 Makefile 编写规则 Makefile 编写规则生成的目标文件:依赖文件生成目标文件所需执行的动作(注:命令行前需加Tab推进) 例: VPATH=inc src main:ma ...
plpgsql 编译执行
Oracle 的存储过程或函数提供了两种执行方式: 解释执行:将源代码逐条转换成目标代码,解释一条,执行一条的过程.PLPGSQL将语句翻译成中间形式的系统代码,并在运行时进行解释. 编译执行:将源代 ...
Java 多线程：基础
Java 多线程:基础作者:Grey 原文地址: 博客园:Java 多线程:基础 CSDN:Java 多线程:基础顺序.并行与并发顺序(sequential)用于表示多个操作『依次』处理.比如把 ...
Github-CLI
Github-CLI Github 的官方命令行工具 Github CLI.Mac 系统可以通过 homebrew 安装或者直接下载免安装包来使用. 命令 Github CLI 的所有命令均以gh开头 ...

基于BP神经网络的手MNIST写数字识别

基于BP神经网络的手MNIST写数字识别的更多相关文章

随机推荐

热门专题