CNN中的卷积核及TensorFlow中卷积的各种实现

声明：

1. 我和每一个应该看这篇博文的人一样，都是初学者，都是小菜鸟，我发布博文只是希望加深学习印象并与大家讨论。

2. 我不确定的地方用了“应该”二字

首先，通俗说一下，CNN的存在是为了解决两个主要问题：

1. 权值太多。这个随便一篇博文都能解释

2. 语义理解。全连接网络结构处理每一个像素时，其相邻像素与距离很远的像素无差别对待，并没有考虑图像内容的空间结构。换句话说，打乱图像像素的输入顺序，结果不变。

然后，CNN中的卷积核的一个重要特点是它是需要网络自己来学习的。这一点很简单也很重要：一般的卷积核如sobel算子、平滑算子等，都是人们根据数学知识得到的，比如求导，平均等等。所以一般的人工卷积核是不能放进卷积层的，这有悖于“学习”的概念。我们神经网络就是要自己学习卷积核的参数。来提取人们想不到甚至是无法理解的空间结构或特征。其他特征包括全局共享（一个卷积核滑动一整张图像），多核卷积（用一个卷积核只能提取一种空间结构或特征）。

最后，说一说TensorFlow中卷积的各种实现API（经常用到的）：

import tensorflow as tf #自己去加，下面用tf代替tensorflow模块

1 tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, Name=None)

#输入:

# input: 一个张量。数据类型必须是float32或者float64。记住这个张量为四维[batch, in_height, in_width, in_channels]，batch应该是指每次feed给网络的数据的个数，和mini-batch gradient descend有关；中间是长宽两项；最后是通道，灰度为1，RGB等为3

# filter: 输入的卷积核，也是四维[filter_height,filter_width,in_channels,channel_multiplier]，前两维是尺寸比如3x3,2x2(注意是可以2x2的，这个涉及到非对称卷积核)，第三维等于 in_channels，第四维是输出通道数，也就是你要输出的通道数，也就是你要使用的卷积核数

# strides: 一个长度是4的一维整数类型的数组，一般设为[1,1,1,1]，注意第一个和第四个"1”固定不变（我试过改了结果不变，并且没有意义）中间的两个1，就是横向步长和纵向步长，意思是卷积核不一定是一步一步的滑动的。

# padding: 有两个值‘SAME’和'VALID'，前者使得卷积后图像尺寸不变；后者尺寸变化

# use_cudnn_on_gpu: 在gpu上处理，tensorflow-gpu都默认设为了True

# data_format=None, Name=None 这两项请博友们自己查查，应该问题不大，Name应该与TensorFlow的图结构以及Session（会话）有关系；data_format的默认值应该为'NHWC'，及张量维度的顺序应该是batch个数，高度，宽度和通道数。

可以说， tf.nn.conv2d就是处理的典型的卷积，例子和图示如下：

 input_data =tf.Variable(np.random.rand(10,9,9,3),dtype=np.float32)

 filter_data = tf.Variable(np.random.rand(2,2,3,2),dtype=np.float32)

 y = tf.nn.conv2d(input_data,filter_data,strides=[2,5,5,3],padding='SAME') #中间5,5大家自己设置一下，自己感受

 y.shape

结果是 TensorShape([Dimension(10), Dimension(2), Dimension(2), Dimension(2)])

2 tf.nn.depthwise_conv2d(input, filter, strides, padding, rate=None, name=None, data_format=None)

与1的不同有有两点：

1. depthwise_conv2d将不同的卷积核独立地应用在in_channels的每个通道：我们一般对于三通道图像做卷积，都是先加权求和再做卷积（注意先加权求和再卷积与先卷积再加权求和结果一样），形象化描述就是我先把3通道压扁成1通道，在把它用x个卷积核提溜成x通道（或者我先把3通道用x个卷积核提溜成3x个通道，再分别压扁得到x通道）；　而depthwise_conv2d就不加权求和了，直接卷积，所以最后输出通道的总数是in_channels*channel_multiplier

2. rate参数是一个1维向量，of size 2，由两个元素组成，这个参数与atrous convolution（孔卷积）和感受野有关，我下面会给出参考链接。注意， If it is greater than 1, then all values of strides must be 1.

3 tf.nn.separable_conv2d(input, depthwise_filter, pointwise_filter, strides, padding, rate=None, name=None, data_format=None)

#特殊参数:

# depthwise_filter。一个张量，数据维度是四维[filter_height,filter_width,in_channels,channel_multiplier]，如1中所述，但是卷积深度是1，如2中所述。

# pointwise_filter。一个张量，数据维度是四维[1,1,in_channels*channel_multiplier,out_channel]

tf.nn.separable_conv2d是利用几个分离的卷积核去做卷积。首先用depthwise_filter做卷积，效果与depthwise_conv2d相同，然后用1x1的卷积核pointwise_filter去做卷积。实例图如下：

这个理解困难就是最后一步，pointwise_filter是什么？需要说明的是，我只知道原理，我还不知道这样做的目的是什么。最后pointwise原理很简单，就和2中我说过的一样，我先把DM*in_channels(即in_channels*channel_multiplier)个通道压扁成1个通道，再用pointwise_filter这个1*1的卷积核提溜成out_channel个通道，所以pointwise_filter相当于out_channel个scalar。

例子如下：

 1 input_data = tf.Variable(np.random.rand(10,9,9,3),dtype=np.float32)

 2 depthwise_filter = tf.Variable(np.random.rand(2,2,3,5),dtype=np.float32)

 3 pointerwise_filter = tf.Variable(np.random.rand(1,1,15,20),dtype=np.float32)

 4 #out_channels >= channel_multiplier * in_channels

 5 y =tf.nn.separable_conv2d(input_data, depthwise_filter, pointerwise_filter, strides = [1,1,1,1], padding='SAME')

 y.shape

结果是 TensorShape([Dimension(10), Dimension(9), Dimension(9), Dimension(20)])

参考资料：

《深度学习原理与Tensorflow实践》
《TensorFlow技术解析与实战》

Tensorflow（API MASTERT），也就是API Documentation

孔卷积或者扩张卷积

图的出处

CNN中的卷积核及TensorFlow中卷积的各种实现的更多相关文章

TensorFlow中卷积
CNN中的卷积核及TensorFlow中卷积的各种实现声明: 1. 我和每一个应该看这篇博文的人一样,都是初学者,都是小菜鸟,我发布博文只是希望加深学习印象并与大家讨论. 2. 我不确定的地方用了“ ...
python/numpy/tensorflow中，对矩阵行列操作，下标是怎么回事儿？
Python中的list/tuple,numpy中的ndarrray与tensorflow中的tensor. 用python中list/tuple理解,仅仅是从内存角度理解一个序列数据,而非数学中标量 ...
tensorflow中的卷积和池化层(一)
在官方tutorial的帮助下,我们已经使用了最简单的CNN用于Mnist的问题,而其实在这个过程中,主要的问题在于如何设置CNN网络,这和Caffe等框架的原理是一样的,但是tf的设置似乎更加简洁. ...
Tensorflow中使用CNN实现Mnist手写体识别
本文参考Yann LeCun的LeNet5经典架构,稍加ps得到下面适用于本手写识别的cnn结构,构造一个两层卷积神经网络,神经网络的结构如下图所示: 输入-卷积-pooling-卷积-pooling ...
在 TensorFlow 中实现文本分类的卷积神经网络
在TensorFlow中实现文本分类的卷积神经网络 Github提供了完整的代码: https://github.com/dennybritz/cnn-text-classification-tf 在 ...
第十四节，TensorFlow中的反卷积，反池化操作以及gradients的使用
反卷积是指,通过测量输出和已知输入重构未知输入的过程.在神经网络中,反卷积过程并不具备学习的能力,仅仅是用于可视化一个已经训练好的卷积神经网络,没有学习训练的过程.反卷积有着许多特别的应用,一般可以用 ...
TensorFlow中的卷积函数
前言最近尝试看TensorFlow中Slim模块的代码,看的比较郁闷,所以试着写点小的代码,动手验证相关的操作,以增加直观性. 卷积函数 slim模块的conv2d函数,是二维卷积接口,顺着源代码可 ...
【深度学习】CNN 中 1x1 卷积核的作用
[深度学习]CNN 中 1x1 卷积核的作用最近研究 GoogLeNet 和 VGG 神经网络结构的时候,都看见了它们在某些层有采取 1x1 作为卷积核,起初的时候,对这个做法很是迷惑,这是因为之前 ...
TensorFlow 中的卷积网络
TensorFlow 中的卷积网络是时候看一下 TensorFlow 中的卷积神经网络的例子了. 网络的结构跟经典的 CNNs 结构一样,是卷积层,最大池化层和全链接层的混合. 这里你看到的代码与你 ...

随机推荐

LeetCode:1. Add Two Numbers
题目: LeetCode:1. Add Two Numbers 描述: Given an array of integers, return indices of the two numbers su ...
自己编写jQuery动态引入js文件插件 (jquery.import.dynamic.script)
这个插件主要是结合jquery或者xhr异步请求来使用的,它可以把已经引入过的js文件记录在浏览器内存中,当下次再引入相同的文件就忽略该文件的引入. 此插件不支持浏览器刷新保存数据,那需要利用cook ...
深入理解Struts2----类型转换
之前的一系列文章主要介绍了有关Struts2的一些基本用法和部分的简单原理,但是始终没有介绍有关拦截器的相关内容,从本篇开始我们将从另一个角度去深入理解框架的使用,核心还是拦截器,但本篇首先 ...
Java调用IDL出错处理
之前有一个java调用idl的详细介绍http://www.cnblogs.com/lizhishan3380/p/4353286.html,里面有提到[需要先在java中加载IDL的java包(ja ...
在JLabel上显示图片，并且图片自适应JLabel的大小
本文转载地址: http://blog.csdn.net/xiaoliangmeiny/article/details/7060250 在写<Core Java>上的示例代码时 ...
JVM、GC与HashMap
阿里巴巴突然来了个面试邀请电话,问了些java底层的东西,不知所措,所以专门花了些时间做了下学习,顺便记录下,好记性不如烂笔头. 一.对JAVA的垃圾回收机制(GC)的理解不同于C/C++需要手工释 ...
React复习小结（一）
一.React的发展 facebook在构建instagram网站的时候遇见两个问题: 1.数据绑定的时候,大量操作真实dom,性能成本太高 2.网站的数据流向太混乱,不好控制于是facebook起 ...
时间序列分析算法【R详解】
简介在商业应用中,时间是最重要的因素,能够提升成功率.然而绝大多数公司很难跟上时间的脚步.但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来.不要担心,本文并不会讨论时间机器,讨论的都是很 ...
Node.js爬虫-爬取慕课网课程信息
第一次学习Node.js爬虫,所以这时一个简单的爬虫,Node.js的好处就是可以并发的执行这个爬虫主要就是获取慕课网的课程信息,并把获得的信息存储到一个文件中,其中要用到cheerio库,它可以让 ...
maven 修改默认的JDK版本
maven jdk 版本配置 maven 默认使用的 jdk 版本新建一个 maven 项目,如下 : 项目左下方出现一个感叹号,JRE 显示的是 1.5 版本.解决方式有两种,一种是配置 pom. ...

CNN中的卷积核及TensorFlow中卷积的各种实现

CNN中的卷积核及TensorFlow中卷积的各种实现的更多相关文章

随机推荐

热门专题