动手实现CNN卷积神经网络

数据集采用的是手写数据集（http://yann.lecun.com/exdb/mnist/）：

本文构建的CNN网络图如下：

　　像素点：28*28 = 784，55000张手写数字图片。

# -*- coding: UTF-8 -*-

import numpy as np

import tensorflow as tf

# 下载并载入 MNIST 手写数字库（55000 * 28 * 28）55000 张训练图像

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('mnist_data', one_hot=True)#将数据保存在mnist_data下

# one_hot 独热码的编码（encoding）形式

# 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 的十位数字

# 0 : 1000000000

# 1 : 0100000000

# 2 : 0010000000

# 3 : 0001000000

# 4 : 0000100000

# 5 : 0000010000

# 6 : 0000001000

# 7 : 0000000100

# 8 : 0000000010

# 9 : 0000000001

# None 表示张量（Tensor）的第一个维度可以是任何长度

# 除以 255 是为了做 归一化（Normalization），把灰度值从 [0, 255] 变成 [0, 1] 区间

# 归一话可以让之后的优化器（optimizer）更快更好地找到误差最小值

input_x = tf.placeholder(tf.float32, [None, 28 * 28]) / 255.  # 输入

output_y = tf.placeholder(tf.int32, [None, 10])  # 输出：10个数字的标签

# -1 表示自动推导维度大小。让计算机根据其他维度的值

# 和总的元素大小来推导出 -1 的地方的维度应该是多少

input_x_images = tf.reshape(input_x, [-1, 28, 28, 1])  # 改变形状之后的输入

# 从 Test（测试）数据集里选取 3000 个手写数字的图片和对应标签

test_x = mnist.test.images[:3000]  # 图片

test_y = mnist.test.labels[:3000]  # 标签

# 构建我们的卷积神经网络：

# 第 1 层卷积

conv1 = tf.layers.conv2d(  #conv2d指的是2维卷积

    inputs=input_x_images,  # 形状 [28, 28, 1]

    filters=32,             # 32 个过滤器，输出的深度（depth）是32

    kernel_size=[5, 5],     # 过滤器在二维的大小是 (5 * 5)

    strides=1,              # 步长是 1

    padding='same',         # same 表示输出的大小不变，因此需要在外围补零 2 圈

    activation=tf.nn.relu   # 激活函数是 Relu

)  # 经过第一层卷积后输出的形状为 [28, 28, 32]

# 第 1 层池化（亚采样）

pool1 = tf.layers.max_pooling2d(

    inputs=conv1,      # 形状 [28, 28, 32]

    pool_size=[2, 2],  # 过滤器在二维的大小是（2 * 2）

    strides=2          # 步长是 2

)  # 经过第 1 层池化后输出的形状 [14, 14, 32]

# 第 2 层卷积

conv2 = tf.layers.conv2d(

    inputs=pool1,          # 形状 [14, 14, 32]

    filters=64,            # 64 个过滤器，输出的深度（depth）是64

    kernel_size=[5, 5],    # 过滤器在二维的大小是 (5 * 5)

    strides=1,             # 步长是 1

    padding='same',        # same 表示输出的大小不变，因此需要在外围补零 2 圈

    activation=tf.nn.relu  # 激活函数是 Relu

)  # 经过第二层卷积后输出的形状为 [14, 14, 64]

# 第 2 层池化（亚采样）

pool2 = tf.layers.max_pooling2d(

    inputs=conv2,      # 形状 [14, 14, 64]

    pool_size=[2, 2],  # 过滤器在二维的大小是（2 * 2）

    strides=2          # 步长是 2

)  # 形状 [7, 7, 64]

# 平坦化（flat）。降维

flat = tf.reshape(pool2, [-1, 7 * 7 * 64])  # 形状 [7 * 7 * 64, ]

# 1024 个神经元的全连接层

dense = tf.layers.dense(inputs=flat, units=1024, activation=tf.nn.relu)

# Dropout : 丢弃 50%（rate=0.5）

dropout = tf.layers.dropout(inputs=dense, rate=0.5)

# 10 个神经元的全连接层，这里不用激活函数来做非线性化了

logits = tf.layers.dense(inputs=dropout, units=10)  # 输出。形状 [1, 1, 10]

# 计算误差（先用 Softmax 计算百分比概率，

# 再用 Cross entropy（交叉熵）来计算百分比概率和对应的独热码之间的误差）

loss = tf.losses.softmax_cross_entropy(onehot_labels=output_y, logits=logits)

#onehot_labels指的是实际的标签值，logits指的是卷积神经网络的预测输出

# Adam 优化器来最小化误差，学习率 0.001

train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

# 精度。计算 预测值 和 实际标签 的匹配程度

# 返回 (accuracy, update_op), 会创建两个局部变量

accuracy = tf.metrics.accuracy(

    labels=tf.argmax(output_y, axis=1),#第一个参数labels为真实标签    注：tf.argmax返回的是最大值的下标

    predictions=tf.argmax(logits, axis=1),)[1]#第二个参数predictions为预测标签

# 创建会话

sess = tf.Session()

# 初始化变量：全局和局部

init = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())

sess.run(init)

# 训练 5000 步。这个步数可以调节

for i in range(5000):

    batch = mnist.train.next_batch(50)  # 从 Train（训练）数据集里取 “下一个” 50 个样本

    train_loss, train_op_ = sess.run([loss, train_op], {input_x: batch[0], output_y: batch[1]})

    if i % 100 == 0:

        test_accuracy = sess.run(accuracy, {input_x: test_x, output_y: test_y})

        print("第 {} 步的 训练损失={:.4f}, 测试精度={:.2f}".format(i, train_loss, test_accuracy))

# 测试：打印 20 个预测值 和 真实值

test_output = sess.run(logits, {input_x: test_x[:20]})

inferred_y = np.argmax(test_output, 1)

print(inferred_y, '推测的数字')  # 推测的数字

print(np.argmax(test_y[:20], 1), '真实的数字')  # 真实的数字

# 关闭会话

sess.close()

　　结果：

动手实现CNN卷积神经网络的更多相关文章

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？
https://www.zhihu.com/question/34681168 CNN(卷积神经网络).RNN(循环神经网络).DNN(深度神经网络)的内部网络结构有什么区别?修改 CNN(卷积神经网 ...
Deep Learning模型之：CNN卷积神经网络（一）深度解析CNN
http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep le ...
[转]Theano下用CNN(卷积神经网络)做车牌中文字符OCR
Theano下用CNN(卷积神经网络)做车牌中文字符OCR 原文地址:http://m.blog.csdn.net/article/details?id=50989742 之前时间一直在看 Micha ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
CNN(卷积神经网络)、RNN(循环神经网络)、DNN，LSTM
http://cs231n.github.io/neural-networks-1 https://arxiv.org/pdf/1603.07285.pdf https://adeshpande3.g ...
day-16 CNN卷积神经网络算法之Max pooling池化操作学习
利用CNN卷积神经网络进行训练时,进行完卷积运算,还需要接着进行Max pooling池化操作,目的是在尽量不丢失图像特征前期下,对图像进行downsampling. 首先看下max pooling的 ...
cnn(卷积神经网络)比较系统的讲解
本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep learning简介 [2]Deep Learning训练过程 [3]Deep Learning模型之 ...
Keras（四）CNN 卷积神经网络 RNN 循环神经网络原理及实例
CNN 卷积神经网络卷积池化 https://www.cnblogs.com/peng8098/p/nlp_16.html 中有介绍以数据集MNIST构建一个卷积神经网路 from keras. ...
TensorFlow——CNN卷积神经网络处理Mnist数据集
CNN卷积神经网络处理Mnist数据集 CNN模型结构: 输入层:Mnist数据集(28*28) 第一层卷积:感受视野5*5,步长为1,卷积核:32个第一层池化:池化视野2*2,步长为2 第二层卷积 ...

随机推荐

C# [ThreadStatic] 标记静态字段对多线程执行的影响
类的静态字段在类的实例中是共享的.多个线程修改实例字段的值在对其它线程来说是可见的,这也是clr默认的行为.对静态字段添加ThreadStaticAttribute标记可以改变这种默认的行为. Thr ...
常用学习&面试资源网站
https://github.com/MZCretin/RollToolsApi 开源通用API https://github.com/SenhLinsh/Android-Hot-Libraries ...
011-多线程-JUC集合-Queue-PriorityBlockingQueue和DelayQueue
一.PriorityBlockingQueue简介 PriorityBlockingQueue是一个支持优先级的无界阻塞队列.默认情况下元素采用自然顺序升序排列.也可以自定义类实现compareTo( ...
SpringCloud学习成长之十一 Docker部署cloud项目
一.docker简介 Docker是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的.可移植的.自给自足的容器.开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署,包括VMs(虚拟机). ...
Python基础之set集合与函数
set集合集合是一个无序且不重复的元素组合,以大括号表示.使用详情: >>> b=set(a) >>> type(b) <class 'set'> & ...
Day5作业,商城+ATM机+后台管理
晚来了....东西太多,需要写的blog内容太多,re讲的渣渣,不明白为什么oldboy经常换老师,吐槽下吧,真心不爱了.... github地址在这:https://github.com/ccorz ...
springboot下jar包方式运行Caused by: java.lang.ExceptionInInitializerError: null
idea调试过程中不会出现此问题,异常如下 org.springframework.beans.factory.BeanCreationException: Error creating bean w ...
iOS-UILabel的使用
常用属性UILabel //显示的文字 @property(nonatomic,copy) NSString *text; //字体 @property(nonatomic, ...
Python（1）自动发送邮件
python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用.smtplib模块主要负责发送邮件,email模块主要负责构造邮件. sm ...
解决 OpenCV with CUDA 编译提示缺少 nvcuvid.h 的问题
系统环境: 操作系统:Ubuntu 18.04.01 显卡型号:GeForce GTX 1060 6G CMake 版本:3.10.2 GCC 版本:7.4.0 GNU Make 版本:4.1 CUD ...

动手实现CNN卷积神经网络

动手实现CNN卷积神经网络的更多相关文章

随机推荐

热门专题