TFboy养成记 CNN

1/先解释下CNN的过程：

首先对一张图片进行卷积，可以有多个卷积核，卷积过后，对每一卷积核对应一个chanel，也就是一张新的图片，图片尺寸可能会变小也可能会不变，然后对这个chanel进行一些pooling操作。

最后pooling输出完成，这个算作一个卷积层。

最后对最后一个pooling结果进行一个简单的MLP的判别其就好了

2.代码分步:

2.1 W and bias:注意不要将一些W设为0，一定要注意，这个会在后面一些地方讲到

 #注意不要将一些W设为0，一定要注意，这个会在后面一些地方讲到

 def getWeights(shape):

     return tf.Variable(tf.truncated_normal(shape,stddev= 0.1))

 def getBias(shape):

     return tf.Variable(tf.constant(0.1))

2.2 卷积层操作：

首先说下tf.nn.conv2d这个函数：

其中官方解释：

这里主要需要了解的是strides的含义：其shape表示的是[batch, in_height, in_width, in_channels]。需要注意的是，看我们在Weights初始化时的shape,我们自己定义的shape格式是[h,w,inchanel,outchanel] --->chanel也就是我们理解的厚度。

 def conv2d(x,W):

     return tf.nn.conv2d(x,W,strides = [1,1,1,1],padding="SAME")

 #ksize

 def maxpooling(x):

     return tf.nn.max_pool(x,ksize=[1,2,2,1],strides = [1,2,2,1],padding= "SAME")

关于data_format

padding也有两种方式：

其他地方其实也没有什么新操作所有代码在下面：

 # -*- coding: utf-8 -*-

 """

 Spyder Editor

 This is a temporary script file.

 """

 from tensorflow.examples.tutorials.mnist import input_data

 import tensorflow as tf

 import numpy as np

 #注意不要将一些W设为0，一定要注意，这个会在后面一些地方讲到

 def getWeights(shape):

     return tf.Variable(tf.truncated_normal(shape,stddev= 0.1))

 def getBias(shape):

     return tf.Variable(tf.constant(0.1))

 #构造卷积层 strides前一个跟最后后一个为1，其他表示方向，padding一般是有两种方式 ，一个是SAME还有一个是VALID

 #前者卷积后不改变大小后一个卷积后一般会变小

 #strides--->data_format:data_format: An optional string from: "NHWC", "NCHW". Defaults to "NHWC". Specify the data format of the input and output data. With the default format "NHWC", the data is stored in the order of: [batch, height, width, channels]. Alternatively, the format could be "NCHW", the data storage order of: [batch, channels, height, width].

 #

 def conv2d(x,W):

     return tf.nn.conv2d(x,W,strides = [1,1,1,1],padding="SAME")

 #ksize

 def maxpooling(x):

     return tf.nn.max_pool(x,ksize=[1,2,2,1],strides = [1,2,2,1],padding= "SAME")

 def compute_acc(v_xs,v_ys):

     global predict

     y_pre = sess.run(predict,feed_dict = {xs:v_xs,keep_prob:1})

     tmp = tf.equal(tf.arg_max(y_pre,1),tf.arg_max(v_ys,1))

     accuracy = tf.reduce_mean(tf.cast(tmp,tf.float32))

     return sess.run(accuracy,feed_dict = {xs:v_xs,ys:v_ys,keep_prob:1})

 mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

 xs = tf.placeholder(tf.float32,[None,28*28])

 ys = tf.placeholder(tf.float32,[None,10])

 keep_prob = tf.placeholder(tf.float32)

 x_images = tf.reshape(xs,[-1,28,28,1])

 W_c1 = getWeights([5,5,1,32])

 b_c1 = getBias([32])

 h_c1 = tf.nn.relu(conv2d(x_images,W_c1)+b_c1)

 h_p1 = maxpooling(h_c1)

 W_c2 = getWeights([5,5,32,64])

 b_c2 = getBias([64])

 h_c2 = tf.nn.relu(conv2d(h_p1,W_c2)+b_c2)

 h_p2 = maxpooling(h_c2)

 W_fc1 = getWeights([7*7*64,1024])

 b_fc1 = getBias([1024])

 h_flat = tf.reshape(h_p2,[-1,7*7*64])

 h_fc1 = tf.nn.relu(tf.matmul(h_flat,W_fc1)+b_fc1)

 h_fc1_drop = tf.nn.dropout(h_fc1,keep_prob)

 W_fc2 = getWeights([1024,10])

 b_fc2 = getBias([10])

 predict = tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2)+b_fc2)

 loss = tf.reduce_mean(-tf.reduce_sum(ys*tf.log(predict),

                                      reduction_indices=[1]))

 train_step = tf.train.AdamOptimizer(0.001).minimize(loss)

 sess = tf.Session()

 sess.run(tf.initialize_all_variables())

 for i in range(1000):

     batch_xs, batch_ys = mnist.train.next_batch(100)

     sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys, keep_prob: 0.5})

     if i % 50 == 0:

         print (compute_acc(mnist.test.images,mnist.test.labels))

需要注意的是nn.dropout()

TFboy养成记 CNN的更多相关文章

TFBOY 养成记一些比较好多文章。
API解释中文版(简书文章,没事看看): http://www.jianshu.com/p/e3a79eac554f Tensorlfow op辨异:tf.add()与tf.nn.bias_add() ...
TFboy养成记 MNIST Classification （主要是如何计算accuracy）
参考:莫烦. 主要是运用的MLP.另外这里用到的是批训练: 这个代码很简单,跟上次的基本没有什么区别. 这里的lossfunction用到的是是交叉熵cross_entropy.可能网上很多形式跟这里 ...
TFboy养成记 tf.cast,tf.argmax，tf.reduce_sum
referrence: 莫烦视频先介绍几个函数 1.tf.cast() 英文解释: 也就是说cast的直译,类似于映射,映射到一个你制定的类型. 2.tf.argmax 原型: 含义:返回最大值所在 ...
TFboy养成记 tensorboard
首先介绍几个用法: with tf.name_scope(name = "inputs"): 这个是用于区分区域的.如,train,inputs等. xs = tf.placeho ...
TFboy养成记多层感知器 MLP
内容总结与莫烦的视频. 这里多层感知器代码写的是一个简单的三层神经网络,输入层,隐藏层,输出层.代码的目的是你和一个二次曲线.同时,为了保证数据的自然,添加了mean为0,steddv为0.05的噪声 ...
TFboy养成记 tensor shape到底怎么说
tensor.shape 对于一位向量,其形式为[x,] 对于矩阵,二维矩阵[x,y],三维矩阵[x,y,z] 对于标量,也就是0.3*x这种0.3,表示形式为() 如果说这个矩阵是三维的,你想获得其 ...
TFboy养成记简单小程序（Variable & placeholder）
学习参考周莫烦的视频. Variable:主要是用于训练变量之类的.比如我们经常使用的网络权重,偏置. 值得注意的是Variable在声明是必须赋予初始值.在训练过程中该值很可能会进行不断的加减操作变 ...
TFboy养成记
转自:http://www.cnblogs.com/likethanlove/p/6547405.html 在tensorflow的使用中,经常会使用tf.reduce_mean,tf.reduce_ ...
2016级算法第六次上机-F.AlvinZH的学霸养成记VI
1082 AlvinZH的学霸养成记VI 思路难题,凸包. 分析问题,平面上给出两类点,问能否用一条直线将二者分离. 首先应该联想到这是一个凸包问题,分别计算两类点的凸包,如果存在符合题意的直线,那 ...

随机推荐

js实现微信朋友圈模糊图片功能
本人第一次写文章 ,写的不好大家就凑合着看吧. 界面的简单效果. 主要html如下 <div id="content">  <i ...
fedora 19 gnome 3.8 关闭笔记本盖子的动作
gnome-tweak-tool里没有了相关选项,但是又想让关闭盖子不挂起,后来看看才知道gnome3.8不再提供这功能,而是交给systemd来处理,所以估计用dconf-edit在gnome的po ...
【ASP.NET MVC 学习笔记】- 02 Attribute
本文参考:http://www.cnblogs.com/willick/p/3208427.html 1.特性(Attribute)对程序中的元素进行标注,比如类.字段.方法.属性等. 2.在.NET ...
双端链表--Java实现
/*双端链表--比普通链表多了一个指向最后一个节点的引用 * 特点: 链表可以进行尾巴插入--输出顺序和输入顺序一致 * 但是不可以进行尾巴删除因为没有倒数第二节点的引用 * */ public cl ...
如何从零绘制k线图 -- 原生js canvas图表绘制
样式如下图源码地址: https://github.com/sutianbinde/charts 编写这个需要具备canvas基础,如果没有canvas基础可以学习我前面的cnavas基础博客. 具 ...
从零起步学python计划及感想
从纯传统bi转型过来的技术顾问,比较有优势的是对业务的熟悉,对数据有敏感度,熟悉数据模型.但是长年累月基本都是用sql处理问题.目前还没有经历过sql解决不了的问题,一个sql解决不了就用临时表,几个 ...
Go语言之三驾马车
作者:唐郑望,腾讯后台开发工程师商业转载请联系腾讯WeTest获得授权,非商业转载请注明出处. WeTest 导读 Go语言的三个核心设计: interface | goroutine | cha ...
vue之地址栏#号问题
mode的两个值 histroy:当你使用 history 模式时,URL 就像正常的 url,例如 http://jsapng.com/lms/,也好看! hash:默认'hash'值,但是hash ...
Leetcode题解（五）
17.Letter Combinations of a Phone Number 题目针对输入的数字串,每一个数字都对应对个字符可以选择.因此可以直接采用递归的思想,依次遍历数字串的每一个数字,处理 ...
Dragon Balls
Dragon Balls Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total ...

TFboy养成记 CNN

TFboy养成记 CNN的更多相关文章

随机推荐

热门专题