上一节,我们完成了网络训练代码的实现,还有一些问题需要做进一步的确认。网络的最终目标是,输入一张手写数字图片后,网络输出该图片对应的数字。由于网络需要从0到9一共十个数字中挑选出一个,于是我们的网络最终输出层应该有十个节点,每个节点对应一个数字。假设图片对应的是数字0,那么输出层网络中,第一个节点应该输出一个高百分比,其他节点输出低百分比,如果图片对应的数字是9,那么输出层最后一个节点应该输出高百分比,其他节点输出低百分比,例如下图:

屏幕快照 2018-05-07 下午5.10.59.png

高比率,如果网络认为图片对应的数字是0,那么编号为0的节点输出0.95的高比率。最后一个例子是很有意思,编号为4和9的神经元都输出一个不低的比率,这表明图片对应的数字很像4和9,但神经网络认为是9的概率是4的概率的两倍以上。

还记得上一节我们准备好要输入网络的数据吗:

这里写图片描述

数据的第一个值代表图片对应的数字,我们需要把这种对应信息通过代码表现出来:

#最外层有10个输出节点onodes = 10
targets = numpy.zeros(onodes) + 0.01
targets[int(all_values[0])] = 0.99print(targets)

上面代码的输出结果为:

image.png

targets第8个元素的值是0.99,这表示图片对应的数字是7,记住数组是从编号0开始的。根据这种做法,我们就能把输入图片给对应的正确数字建立联系,这种联系就可以用于输入到网络中,进行训练。由于一张图片总共有28*28 = 764个数值,因此我们需要让网络的输入层具备764个输入节点,于是网络的初始化以及将数据输入网络进行训练的实现代码为:

#初始化网络input_nodes = 784hidden_nodes = 100output_nodes = 10learning_rate = 0.3n = NeuralNetWork(input_nodes, hidden_nodes, output_nodes, learning_rate)#读入训练数据#open函数里的路径根据数据存储的路径来设定training_data_file = open("/Users/chenyi/Documents/人工智能/mnist_train_100.csv")
trainning_data_list = training_data_file.readlines()
training_data_file.close()#把数据依靠','区分,并分别读入for record in trainning_data_list:
    all_values = record.split(',')
    inputs = (numpy.asfarray(all_values[1:]))/255.0 * 0.99 + 0.01
    #设置图片与数值的对应关系
    targets = numpy.zeros(output_nodes) + 0.01
    targets[int(all_values[0])] = 0.99
    n.train(inputs, targets)

这里需要注意的是,中间层的节点我们选择了100个神经元,这个选择其实是经验值,也就是中间层的节点数其实没有专门的办法去规定,其数量会根据不同的问题而变化,确定中间层神经元节点数最好的办法是实验,你不停的选取各种数量,看看那种数量能使得网络的表现最好就行。

上面代码把一百条数据输入网络进行训练,现在我们看看训练后的网络它的表现怎样。我们先从加载另一组数据,取出其中一张手写数字图片,将其输入到网络中,看看网络的判断结果如何:

test_data_file = open("/Users/chenyi/Documents/人工智能/mnist_test_10.csv")
test_data_list = test_data_file.readlines()
test_data_file.close()import numpyimport matplotlib.pyplot
%matplotlib inline#把数据依靠','区分,并分别读入all_values = data_list[0].split(',')#第一个值对应的是图片的表示的数字,所以我们读取图片数据时要去掉第一个数值image_array = numpy.asfarray(all_values[1:]).reshape((28, 28))
matplotlib.pyplot.imshow(image_array, cmap='Greys', interpolation='None')

这段代码我们在上一节讲解过,我们把测试数据里面的第一张手写数字图片先绘制出来,代码运行结果如下:

这里写图片描述

通过人眼观察,我们基本确定这种图片对应的是数字7,那么网络识别它的结果如何呢,我们将这张图片的数字输入到网络看看其识别结果:

n.query(numpy.asfarray(all_values[1:]) / 255.0  * 0.99 + 0.01)

上面这行代码运行后结果如下:

这里写图片描述

前面我们讨论过最外层节点输出的意义,最外层节点有十个,分别对应0到9十个数字,哪个节点输出的数值高,那意味着网络认为图片对应哪个数字,我们看到网络输出中,对应编号为7的节点输出值最大,为0.68,也就是说网络把图片识别为数字7,这与我们的观察是一致的,这么说我们辛辛苦苦打造的网络是有效的,前面那么多的铺垫到现在终于有了收获。

我们原来给网络输入的训练数据来自trainning_set,而现在给网络判断的图片来自testing_set,因此网络从未见过这张图片,它能识别这张图片是数字7,这种能力是通过分析训练图片,不断改进链路权重值的结果。实现网络的Python代码不过百来行,他居然就能实现了我们所认为的人工智能,如此看来人工智能似乎并非那么神秘。

接着我们把所有测试图片都输入网络,看看它检测的效果如何,代码如下:

scores = []for record in test_data_list:
    all_values = record.split(',')
    correct_number = int(all_values[0])    print("该图片对应的数字为:",correct_number)    #预处理数字图片
    inputs = (numpy.asfarray(all_values[1:])) / 255.0 * 0.99 + 0.01    #让网络判断图片对应的数字
    outputs = n.query(inputs)    #找到数值最大的神经元对应的编号
    label = numpy.argmax(outputs)    print("out put reslut is : ", label)    #print("网络认为图片的数字是:", label)
    if label == correct_number:
        scores.append(1)    else:
        scores.append(0)print(scores)

上面代码把测试数据集里的10张图片全部加载,然后输入到网络中,看看网络对每张数字图片的识别效果如何,上面代码运行后结果如下:

这里写图片描述

从输出结果看,有些图片网络还是识别错了,最后代码打印出一个数组,里面的1表示识别正确,0表示识别错误,从数组内容看,有4张图片网络给出了错误答案。这次的结果多少令人有些沮丧,我们计算一下图片判断的成功率:

scores_array = numpy.asarray(scores)print("perfermance = ", scores_array.sum() / scores_array.size)

代码运行后结果如下:

这里写图片描述

由此看来,网络识别的成功率只有六成。为了提升成功率,我们必须加大网络的训练力度,原来我们训练网络时只使用了100条数据,现在我们使用60000条数据,然后用10000条数据作为测试集,我们从以下两个链接获取相应的数据集:

http://www.pjreddie.com/media/files/mnist_train.csvhttp://www.pjreddie.com/media/files/mnist_test.csv

然后我们把原来代码做一点小修改,加载上面的数据来对网络进行训练和测试:

#初始化网络input_nodes = 784
hidden_nodes = 100
output_nodes = 10
learning_rate = 0.3
n = NeuralNetWork(input_nodes, hidden_nodes, output_nodes, learning_rate)#读入训练数据#open函数里的路径根据数据存储的路径来设定training_data_file = open("/Users/chenyi/Documents/人工智能/mnist_train.csv")
trainning_data_list = training_data_file.readlines()print(len(trainning_data_list))
training_data_file.close()#把数据依靠','区分,并分别读入for record in trainning_data_list:
    all_values = record.split(',')
    inputs = (numpy.asfarray(all_values[1:]))/255.0 * 0.99 + 0.01    #设置图片与数值的对应关系
    targets = numpy.zeros(output_nodes) + 0.01
    targets[int(all_values[0])] = 0.99
    n.train(inputs, targets)
    
test_data_file = open("/Users/chenyi/Documents/人工智能/mnist_test.csv")
test_data_list = test_data_file.readlines()
test_data_file.close()
scores = []for record in test_data_list:
    all_values = record.split(',')
    correct_number = int(all_values[0])    #预处理数字图片
    inputs = (numpy.asfarray(all_values[1:])) / 255.0 * 0.99 + 0.01    #让网络判断图片对应的数字
    outputs = n.query(inputs)    #找到数值最大的神经元对应的编号
    label = numpy.argmax(outputs)    if label == correct_number:
        scores.append(1)    else:
        scores.append(0)
scores_array = numpy.asarray(scores)print("perfermance = ", scores_array.sum() / scores_array.size)

上面代码跟以前是一样的,只不过加载的数据文件不同而已,这次我们用60000条数据来训练网络,然后用10000条数据来检测网络的准确性,上面代码执行后结果如下:

这里写图片描述

从结果上看,当训练网络的数据流增大后,网络识别的正确性由原来的0.6提升到0.9,我们再次用新训练后的网络识别原来那十张数字图片,得到结果如下:

这里写图片描述

经过大数据训练后的网络,对图片的识别率达到了百分之百,这意味着当用于训练网络的数据越多,网络识别的效果就越好,这就是为何在某种程度上说,人工智能也是大公司的大杀器,因为只有大公司才能拥有足量的数据。

在整个过程,我们一直保持着学习率不变,实际上学习率的大小对网络的训练效果有很大影响,大家可以把该参数改成0.6,0.1等不同的值去看看结果,另外也可以修改中间层的节点数看看有什么效果。二手叉车哪家好

这里我们引入在第一节时提到的一个概念叫epocs,它表示网络进行几次训练循环,对其使用的代码如下:

#加入epocs,设定网络的训练循环次数epochs = 10for e in range(epochs):    #把数据依靠','区分,并分别读入
    for record in trainning_data_list:
        all_values = record.split(',')
        inputs = (numpy.asfarray(all_values[1:]))/255.0 * 0.99 + 0.01
        #设置图片与数值的对应关系
        targets = numpy.zeros(output_nodes) + 0.01
        targets[int(all_values[0])] = 0.99
        n.train(inputs, targets)

也就是在原来网络训练的基础上再加上一层外循环,上面代码运行后执行的对于普通电脑而言执行的时间会很长。一般来说,epochs 的数值越大,网络被训练的就越精准,但如果超过一个阈值,网络就会引发一个过渡拟合的问题,也就是网络会对老数据识别的很精准,但对新数据识别的效率反而变得越来越低,大家可以自行尝试一下不同的学习率和epochs组合,看看网络的识别精度是否有所提高,另外大家也可以修改中间层的节点数看看其对网络的识别精度是否有显著影响,在我电脑上把epochs设置成7时,成功率能提升到95%。

用python实现数字图片识别神经网络--启动网络的自我训练流程,展示网络数字图片识别效果的更多相关文章

  1. Python机器学习笔记:卷积神经网络最终笔记

    这已经是我的第四篇博客学习卷积神经网络了.之前的文章分别是: 1,Keras深度学习之卷积神经网络(CNN),这是开始学习Keras,了解到CNN,其实不懂的还是有点多,当然第一次笔记主要是给自己心中 ...

  2. Python之TensorFlow的卷积神经网络-5

    一.卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度 ...

  3. 将Python项目打包成EXE可执行文件(单文件,多文件,包含图片)

    解决 将Python项目打包成EXE可执行文件(单文件,多文件,包含图片) 1.当我们写了一个Python的项目时,特别是一个GUI项目,我们特备希望它能成为一个在Windows系统可执行的EXE文件 ...

  4. Python实现在给定整数序列中找到和为100的所有数字组合

    摘要:  使用Python在给定整数序列中找到和为100的所有数字组合.可以学习贪婪算法及递归技巧. 难度:  初级 问题 给定一个整数序列,要求将这些整数的和尽可能拼成 100. 比如 [17, 1 ...

  5. 移动端禁止图片长按和vivo手机点击img标签放大图片,禁止长按识别二维码或保存图片【转载】

    移动端禁止图片长按和vivo手机点击img标签放大图片,禁止长按识别二维码或保存图片 img{ pointer-events: none; } 源文地址:https://www.cnblogs.com ...

  6. Python爬虫实例(一)爬取百度贴吧帖子中的图片

    程序功能说明:爬取百度贴吧帖子中的图片,用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取. 思路分析: 一.指定贴吧url的获取 例如我们进入秦时明月吧,提取并分析其有效url如下 http:// ...

  7. iOS 实现启动屏动画(Swift实现,包含图片适配)

    代码地址如下:http://www.demodashi.com/demo/12090.html 准备工作 首先我们需要确定作为宣传的图片的宽高比,这个一般是与 UI 确定的.一般启动屏展示会有上下两部 ...

  8. Python 数据处理之对 list 数据进行数据重排(为连续的数字序号)

    Python 数据处理之对 list 数据进行数据重排(为连续的数字序号) # user ID 序号重新排,即,原来是 1,3,4,6 ,排为 1,2,3,4 # item ID 序号重新排,too ...

  9. Python使用numpy实现BP神经网络

    Python使用numpy实现BP神经网络 本文完全利用numpy实现一个简单的BP神经网络,由于是做regression而不是classification,因此在这里输出层选取的激励函数就是f(x) ...

随机推荐

  1. Sequelize-nodejs-6-Instances

    Instances实例 Building a non-persistent instance构建非持久性实例 In order to create instances of defined class ...

  2. 文件操作示例脚本 tcl

    linux 下,经常会对用到文件操作,下面是一个用 tcl 写的文件操作示例脚本: 其中 set f01 [open "fix.tcl" w] 命令表示 打开或者新建一个文件“fi ...

  3. Javascript中的继承与Prototype

    之前学习js仅仅是把w3school上的基本语法看了一次而已,再后来细看书的时候,书中会出现很多很多没有听过的语法,其中一个就是js的继承以及总能看到的prototype.我主要在看的两本js书是&l ...

  4. Xilinx实习一年总结

    从去年7月4号来到上海xilinx.转眼间已经一年.这一年学了非常多知识,也长了非常多见识. 去年七月一到公司,马上投入到摄像头-DDR-HDMI图像通路的研发中.就是在ZEDboard板卡上.通过外 ...

  5. libmxml数据结构(源码分析)

    libmxml是一个开源.小巧的C语言xml库.这里简单分析一下它是用什么样的数据结构来保存分析过的xml文档. mxml关键的结构体mxml_node_t是这样的实现的: struct mxml_n ...

  6. UOJ#34. 多项式乘法(NTT)

    这是一道模板题. 给你两个多项式,请输出乘起来后的多项式. 输入格式 第一行两个整数 nn 和 mm,分别表示两个多项式的次数. 第二行 n+1n+1 个整数,表示第一个多项式的 00 到 nn 次项 ...

  7. SuperObject Delphi 的 JSON 属性乱序 - 操作类改造 - 关于属性顺序的问题

    Delphi 的 ISuperObject 属性顺序为随机.但是很多时候,是需要按加入顺序进行读取.我也看了网上很多人有类似需求.也有人问过原作者,作者答复为:JSON协议规定为无序.看了我真是无语. ...

  8. 20155321 《信息安全系统设计》课堂测试(ch06)

    20155321 <信息安全系统设计>课堂测试(ch06) (单选题|1分)下面代码中,对数组x填充后,采用直接映射高速缓存,所有对x和y引用的命中率为() A .1 B .1/4 C . ...

  9. 22-[jQuery]-选择器, js jQuery对象转换

    1.基础选择器 <!DOCTYPE html> <html lang="en"> <head> <meta charset="U ...

  10. jquery.validata1.11怎么支持metadata

    使用metadata方式这个需要使用jquery.metadata.js插件才可工作,通过在表单项中定义特殊的属性来指定验证规则 但是最新的jquery.validate 1.11没有内置metada ...