CNN卷积神经网络的构建

1.卷积神经网络由输入层，卷积层，激活函数，池化层，全连接层组成.

input(输入层)--conv(卷积层)--relu(激活函数)--pool(池化层)--fc(全连接层)

2.卷积层：

主要用来进行特征的提取

卷积操作是使用一个二维的卷积核在一个批处理的图片上进行不断扫描。具体操作是将一个卷积核在每张图片上按照一个合适的尺寸在每个通道上面进行扫描。

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)
这个函数的作用是对一个四维的输入数据 input 和四维的卷积核 filter 进行操作，然后对输入数据进行一个二维的卷积操作，最后得到卷积之后的结果。

tf.nn.bias_add(value, bias, name = None)：这个函数的作用是将偏差项 bias 加到 value 上面。

3.激活函数

在神经网络中，激活函数的作用是能够给神经网络加入一些非线性因素，使得神经网络可以更好地解决较为复杂的问题。

在神经网络中，我们有很多的非线性函数来作为激活函数，比如连续的平滑非线性函数（sigmoid，tanh和softplus），连续但不平滑的非线性函数（relu，relu6和relu_x）和随机正则化函数（dropout）。

所有的激活函数都是单独应用在每个元素上面的，并且输出张量的维度和输入张量的维度一样。

常用的激活函数：

（1）tf.nn.relu(features, name = None)：这个函数的作用是计算激活函数relu，即max(features, 0)

（2）tf.nn.relu6(features, name = None)：这个函数的作用是计算激活函数relu6，即min(max(features, 0), 6)

（3）tf.nn.softplus(features, name = None)：这个函数的作用是计算激活函数softplus，即log( exp( features ) + 1)。

（4）tf.sigmoid(x, name = None)：这个函数的作用是计算 x 的 sigmoid 函数。具体计算公式为 y = 1 / (1 + exp(-x))。

（5）tf.tanh(x, name = None)：这个函数的作用是计算 x 的 tanh 函数。具体计算公式为 ( exp(x) - exp(-x) ) / ( exp(x) + exp(-x) )。

激活函数应该具有的特征：

（1）非线性。线性激活层对于深层神经网络没有作用，因为其作用以后仍然是输入的各种线性变换。。
（2）连续可微。梯度下降法的要求。
（3）范围最好不饱和，当有饱和的区间段时，若系统优化进入到该段，梯度近似为0，网络的学习就会停止。
（4）单调性，当激活函数是单调时，单层神经网络的误差函数是凸的，好优化。
（5）在原点处近似线性，这样当权值初始化为接近0的随机值时，网络可以学习的较快，不用可以调节网络的初始值。

4.池化层

主要是对输入的特征图进行压缩，一方面使特征图变小，简化网络计算负责度，另一方面进行特征压缩，提取主要特征。

迟化操作一般有两种：Avy Pooling和max Pooling

max Pooling：计算迟化区域中元素的最大值

5.Dropout 防止过拟合

当训练数据量比较小时，可能会出现因为追求最小差值导致训练出来的模型极度符合训练集，但是缺乏普适性，不能表达训练数据之外的数据

解决方案：

tf.nn.dropout(x, keep_prob, noise_shape = None, seed = None, name = None)

Dropout就是在不同的训练过程中随机扔掉一部分神经元也就是让某个神经元的激活值以一定的概率p，让其停止工作，这次训练过程中不更新权值，也不参加神经网络的计算。但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了。如下图：

6.全连接层

连接所有的特征，将输出值送给分类器

7.总体的结构

8.CNN代码实现预测手写数字

 import warnings

 warnings.filterwarnings('ignore')

 import numpy as np

 import tensorflow as tf

 from tensorflow.examples.tutorials.mnist import input_data

 # 加载数据，one-hot形式

 mnist = input_data.read_data_sets('./',one_hot=True)

 # 卷积方法

 def conv(input_data,filter_,b):

     return tf.nn.conv2d(input_data,filter_,[1,1,1,1],'SAME') + b

 # 池化：降维

 def pool(input_data):

     return tf.nn.max_pool(input_data,[1,2,2,1],[1,2,2,1],'SAME')

 # 变量

 def gen_v(shape):

     return tf.Variable(initial_value=tf.random_normal(shape = shape,dtype = tf.float64))

 # 第一层卷积

 X = tf.placeholder(shape = [None,784],dtype=tf.float64)

 y = tf.placeholder(shape = [None,10],dtype=tf.float64)

 input_data = tf.reshape(X,shape = [-1,28,28,1])

 filter1 = gen_v([3,3,1,32])

 b1 = gen_v([32])

 conv1 = tf.nn.relu(conv(input_data,filter1,b1))

 pool1 = pool(conv1)

 # pool1 shape=(?, 14, 14, 32)

 # 第二层卷积

 filter2 = gen_v([3,3,32,64])

 b2 = gen_v([64])

 conv2 = tf.nn.relu(conv(pool1,filter2,b2))

 pool2 = pool(conv2)

 # pool2 shape=(?, 7, 7, 64)

 # 第三层卷积

 filter3 = gen_v([3,3,64,64])

 b3 = gen_v([64])

 conv3 = tf.nn.relu(conv(pool2,filter3,b3))

 pool3 = pool(conv3)

 # pool3 shape=(?, 4, 4, 64)

 # 全连接层1024个神经元，输出1024个神经元

 fc = tf.reshape(pool3,shape = [-1,4*4*64])

 fc_w = gen_v([4*4*64,1024])

 fc_b = gen_v([1024])

 conn = tf.nn.relu(tf.matmul(fc,fc_w) + fc_b)

 # conn shape=(?, 1024)

 # 防止过拟合dropout

 rate = tf.placeholder(dtype=tf.float64)

 dp = tf.nn.dropout(conn,rate =rate)

 # 输出层，其实就是全连接层

 out_w = gen_v([1024,10])

 out_b = gen_v([10])

 out = tf.matmul(dp,out_w) + out_b

 # out shape=(?,10)

 y_ = tf.nn.softmax(out)

 # 构建损失函数

 loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y,logits = out))

 # 优化梯度下降

 opt = tf.train.AdamOptimizer(0.001).minimize(loss)

 # 训练

 saver = tf.train.Saver()

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     for i in range(10):

         for j in range(100):

             X_train,y_train = mnist.train.next_batch(550)

             opt_,loss_ = sess.run([opt,loss],feed_dict = {X:X_train,y:y_train,rate:0.5})

             print('里层循环执行次数：%d。损失是：%0.4f'%(j+1,loss_))

 #         计算准确率

         X_validation ,y_validation = mnist.validation.next_batch(2000)

         y_pred = sess.run(y_,feed_dict = {X:X_validation,rate:0})

         accuracy = (np.argmax(y_pred,axis = -1) == np.argmax(y_validation,axis = -1)).mean()

         print('--------------------循环执行%d。准确率是%0.4f-------------------'%(i+1,accuracy))

         saver.save(sess,'./model/three_cnn')

CNN预测手写数字

CNN卷积神经网络的构建的更多相关文章

Deep Learning模型之：CNN卷积神经网络（一）深度解析CNN
http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep le ...
cnn(卷积神经网络)比较系统的讲解
本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep learning简介 [2]Deep Learning训练过程 [3]Deep Learning模型之 ...
Keras（四）CNN 卷积神经网络 RNN 循环神经网络原理及实例
CNN 卷积神经网络卷积池化 https://www.cnblogs.com/peng8098/p/nlp_16.html 中有介绍以数据集MNIST构建一个卷积神经网路 from keras. ...
[转]Theano下用CNN(卷积神经网络)做车牌中文字符OCR
Theano下用CNN(卷积神经网络)做车牌中文字符OCR 原文地址:http://m.blog.csdn.net/article/details?id=50989742 之前时间一直在看 Micha ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别？
https://www.zhihu.com/question/34681168 CNN(卷积神经网络).RNN(循环神经网络).DNN(深度神经网络)的内部网络结构有什么区别?修改 CNN(卷积神经网 ...
CNN(卷积神经网络)、RNN(循环神经网络)、DNN，LSTM
http://cs231n.github.io/neural-networks-1 https://arxiv.org/pdf/1603.07285.pdf https://adeshpande3.g ...
day-16 CNN卷积神经网络算法之Max pooling池化操作学习
利用CNN卷积神经网络进行训练时,进行完卷积运算,还需要接着进行Max pooling池化操作,目的是在尽量不丢失图像特征前期下,对图像进行downsampling. 首先看下max pooling的 ...
TensorFlow——CNN卷积神经网络处理Mnist数据集
CNN卷积神经网络处理Mnist数据集 CNN模型结构: 输入层:Mnist数据集(28*28) 第一层卷积:感受视野5*5,步长为1,卷积核:32个第一层池化:池化视野2*2,步长为2 第二层卷积 ...

随机推荐

百度艾尼（ERNIE）常见问题汇总及解答
一.ERNIE安装配置类问题 Q1:最适合ERNIE2.0的PaddlePaddle版本是?A1:PaddlePaddle版本建议升级到1.5.0及以上版本. Q2:ERNIE可以在哪些系统上使用?A ...
使用Git-Rebase合并多次提交
在平时的软件开发中,我们每个team使用一个公共仓库(这里说的是Git仓库).每当有一个新的需求,我们会拉出一个特性分支,然后在这个特性分支上做开发以及提交个人的代码. 我有个习惯就是:为了确保代码的 ...
VS反编译查看源码时，会把类实现的所有接口都直接显示
今天在看ArrayList,发现一个很有意思的问题.从VS里反编译看,ArrayList继承了ICollection. IEnumerable.IList和ICloneable,而IList又继承了I ...
Windows系统下搭建WAMP环境
Wamp就是Windos Apache Mysql PHP集成安装环境,即在window下的apache.php和mysql的服务器软件.其中php环境配置是至关重要的一部分,本文就针对php在本地的 ...
ES6，import时如何正确使用花括号'{ }'
在 ES6 之前,社区制定了一些模块加载方案,最主要的有 CommonJS 和 AMD 两种.前者用于服务器,后者用于浏览器.ES6 在语言标准的层面上,实现了模块功能,而且实现得相当简单,完全可以取 ...
[LC]88题 Merge Sorted Array （合并两个有序数组）
①英文题目 Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. N ...
UML分析AsyncDisplayKit框架-ASMuplexImageNode异步下载时序图。
PS:博客园图片服务器不正常工作,数据上传后服务器返回http500,园方迟迟还没解决. 我从2016-01-18 05:52向园方反馈问题-请问博客园的图片服务器有在正常运行吗,至此时2016-01 ...
epoll介绍及使用
小程序功能:简单的父子进程之间的通讯,子进程负责每隔1s不断发送"message"给父进程,不需要跑多个应用实例,不需要用户输入. 首先上代码 #include<assert ...
Asp.net Core 系列之--5.认证、授权与自定义权限的实现
ChuanGoing 2019-11-24 asp.net core系列已经来到了第五篇,通过之前的基础介绍,我们了解了事件订阅/发布的eventbus整个流程,初探dapper ORM实现,并且简单 ...
【NHOI2018】找素数
[题目描述] 素数又称质数,是指一个大于 1 的正整数,如果除了 1 和它本身以外,不能再被其它的数整除,例如:2.3.5.97 等都是素数.2 是最小的素数. 现在,给你 n 个数字,请你从中选取一 ...

CNN卷积神经网络的构建

CNN卷积神经网络的构建的更多相关文章

随机推荐

热门专题