keras与卷积神经网络（CNN）实现识别minist手写数字

在本篇博文当中，笔者采用了卷积神经网络来对手写数字进行识别，采用的神经网络的结构是:输入图片——卷积层——池化层——卷积层——池化层——卷积层——池化层——Flatten层——全连接层（64个神经元）——全连接层（500个神经元）——softmax函数，最后得到分类的结果。Flatten层用于将池化之后的多个二维数组展开成一维数组，再灌入全连接层的神经元当中。

首先导包：

import keras

from keras import layers

from keras import models

建立神经网络的顺序模型：

model = models.Sequential()

添加神经网络的结构（三组卷积层，池化层。一个flatten层，以及两个全连接层）,激活函数我一般喜欢使用relu,当然你也可以使用sigmoid,tanh这两个激活函数，更改我的代码即可。由于是手写数字，最后的softmax一共只能够有十个数字，因此输出写10.激活函数使用softmax。其他都是relu。

model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))

model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Conv2D(64, (3, 3), activation='relu'))

model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Conv2D(64, (3, 3), activation='relu'))

model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Flatten())

model.add(layers.Dense(64, activation='relu'))

model.add(layers.Dense(500, activation='relu'))

model.add(layers.Dense(10, activation='softmax'))

神经网络搭建完毕，开始导minist手写数字，对数字进行分类，分为训练集和验证集，同时将数字进行reshape，代码如下:

from keras.datasets import mnist

from keras.utils import to_categorical

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

train_images = train_images.reshape((60000, 28, 28, 1))

train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))

test_images = test_images.astype('float32') / 255

train_labels = to_categorical(train_labels)

test_labels = to_categorical(test_labels)

紧接着选择需要进行梯度下降的优化器，常见的有adagrad,adam,rmsprop等等，这里选择了rmsprop。损失函数loss function这里选择了Cross Entropy，也就是交叉熵（因为最后是一个softmax函数进行分类，我们常常用交叉熵来衡量模型的准确度，这个计算起来比较方便，也比较有道理）。模型fit的过程当中我选择了mini—batch小批量梯度下降法，用这个方法比较适合电脑，如果使用所有数据进行梯度下降，那么电脑跑很久才能够完成，如果使用小批量梯度下降，电脑则可以自动进行并行计算，时间减少。迭代次数我选择了10次，每一个mini——batch的批量为128，这个无所谓，这个参数适中即可，不可太大也不能太小。代码如下：

model.compile(optimizer='rmsprop',

loss='categorical_crossentropy',

metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10, batch_size=128)

输出：

Epoch 1/10

60000/60000 [==============================] - 42s 703us/step - loss: 0.0192 - acc: 0.9940

Epoch 2/10

60000/60000 [==============================] - 42s 706us/step - loss: 0.0166 - acc: 0.9945

Epoch 3/10

60000/60000 [==============================] - 43s 724us/step - loss: 0.0146 - acc: 0.99580s - loss: 0.0145 - acc: 0.9

Epoch 4/10

60000/60000 [==============================] - 43s 720us/step - loss: 0.0129 - acc: 0.9960

Epoch 5/10

60000/60000 [==============================] - 43s 718us/step - loss: 0.0130 - acc: 0.9962

Epoch 6/10

60000/60000 [==============================] - 44s 728us/step - loss: 0.0105 - acc: 0.9966

Epoch 7/10

60000/60000 [==============================] - 44s 737us/step - loss: 0.0095 - acc: 0.9969

Epoch 8/10

60000/60000 [==============================] - 44s 728us/step - loss: 0.0101 - acc: 0.9972

Epoch 9/10

60000/60000 [==============================] - 44s 735us/step - loss: 0.0085 - acc: 0.9974

Epoch 10/10

60000/60000 [==============================] - 45s 743us/step - loss: 0.0081 - acc: 0.99750s - loss: 0.0081 - acc: 0.997

可以看到模型经过十次迭代，训练集的准确度已经达到了%99.7以上，这样会不会出现过拟合的情况呢？用不用减少一下模型的迭代次数呢？笔者的心里怕怕的，于是用验证集来验证一下模型的准确度：

test_loss, test_acc = model.evaluate(test_images, test_labels)

print(test_acc)

输出：

0.9868

模型的准确度达到了%98.68,接近百分之九十九的样子，比笔者仅用全连接神经网络训练的结果高了零点几的准确度，从中还是可以看出卷积神经网络的有效性，在没有进行调参的情况下准确度已经很高了！

keras与卷积神经网络（CNN）实现识别minist手写数字的更多相关文章

利用神经网络算法的C＃手写数字识别(一)
利用神经网络算法的C#手写数字识别转发来自云加社区,用于学习机器学习与神经网络欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 下载Demo - 2.77 MB (原始地址):handwri ...
利用神经网络算法的C＃手写数字识别(二)
利用神经网络算法的C#手写数字识别(二) 本篇主要内容: 让项目编译通过,并能打开图片进行识别. 1. 从上一篇<利用神经网络算法的C#手写数字识别>中的源码地址下载源码与资源, ...
利用神经网络算法的C＃手写数字识别
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 下载Demo - 2.77 MB (原始地址):handwritten_character_recognition.zip 下载源码 - 70. ...
python-积卷神经网络全面理解-tensorflow实现手写数字识别
首先,关于神经网络,其实是一个结合很多知识点的一个算法,关于cnn(积卷神经网络)大家需要了解: 下面给出我之前总结的这两个知识点(基于吴恩达的机器学习) 代价函数: 代价函数代价函数(Cost F ...
使用卷积神经网络CNN训练识别mnist
算的的上是自己搭建的第一个卷积神经网络.网络结构比较简单. 输入为单通道的mnist数据集.它是一张28*28,包含784个特征值的图片我们第一层输入,使用5*5的卷积核进行卷积,输出32张特征图, ...
吴裕雄 python 神经网络——TensorFlow 使用卷积神经网络训练和预测MNIST手写数据集
import tensorflow as tf import numpy as np from tensorflow.examples.tutorials.mnist import input_dat ...
CNN完成mnist数据集手写数字识别
# coding: utf-8 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data d ...
Tensorflow笔记——神经网络图像识别（五）手写数字识别
多层全连接神经网络实现minist手写数字分类
import torch import numpy as np import torch.nn as nn from torch.autograd import Variable import tor ...

随机推荐

SpringBoot+AOP构建多数据源的切换实践
针对微服务架构中常用的设计模块,通常我们都会需要使用到druid作为我们的数据连接池,当架构发生扩展的时候 ,通常面对的数据存储服务器也会渐渐增加,从原本的单库架构逐渐扩展为复杂的多库架构. 当在业务 ...
can do / will do / should do 情态动词
can do = be able to do will do = be going to do should do = ought to do 情态动词都是表示建议从这里发现 to do (不确定 ...
正则匹配电话号码demo
public static String doFilterTelnum(String sParam) { String result = sParam; if (sParam.length() < ...
java时间切片工具
项目中经常会遇到根据根据时间区间来查询数据的场景, 如时间跨度大可能相应的sql的执行效率会显著降低, 因此可以对时间区间进行切割成若干个小范围的时间片, 这样不仅可以提高sql的性能还可以做一下并发 ...
python报错：ERROR: No matching distribution found for dns.resolver
可能有的小伙伴在安装dns.resolver的时候会遇到这个问题: 我百度的时候别人是: pip install dns-python 但是我这样安装也还是错误.有些时候是这个包改名了所以你没有搜索到 ...
【i春秋综合渗透训练】渗透测试笔记
网站是齐博CMS V7.0 1.要求获得管理员密码: 利用齐博CMS V7.0 SQL爆破注入漏洞即可得到管理员用户名密码 https://www.cnblogs.com/vspid ...
STM32CubeMx——串口使用DMA收发
用到的是DMA发送数据,接收还是普通的串口接收. 一.代码生成 1.按以前的方法设置好时钟和调试方式,这里就不多说了. 2.设置串口1. 3.在DMA Setting里点击Add添加USART1_TX ...
coding++：Java 获取request中的参数
第一种: private Map<String,Object> mapParameters(HttpServletRequest request) { //封装查询条件参数 Map< ...
coding++：java—提取Html文本字符串中的内容
package com.tree.ztree_demo; import java.util.regex.Matcher; import java.util.regex.Pattern; public ...
常见Web安全漏洞--------sql注入
SQL注入:利用现有应用程序,将(恶意)的SQL命令注入到后台数据库执行一些恶意的操作.在mybatis 中比较容易出现:${} 会发生sql 注入问题 #{}: 解析为一个 JDBC 预编译语句(p ...

keras与卷积神经网络（CNN）实现识别minist手写数字

keras与卷积神经网络（CNN）实现识别minist手写数字的更多相关文章

随机推荐

热门专题