前言

最近尝试看TensorFlow中Slim模块的代码，看的比较郁闷，所以试着写点小的代码，动手验证相关的操作，以增加直观性。

卷积函数

slim模块的conv2d函数，是二维卷积接口，顺着源代码可以看到最终调的TensorFlow接口是convolution，这个地方就进入C++层面了，暂时不涉及。先来看看这个convolution函数，官方定义是这样的：

tf.nn.convolution(

    input,

    filter,

    padding,

    strides=None,

    dilation_rate=None,

    name=None,

    data_format=None

)

其中在默认情况下，也就是data_format=None的时候，input的要求格式是[batch_size] + input_spatial_shape + [in_channels], 也就是要求第一维是batch，最后一维是channel，中间是真正的卷积维度。所以这个接口不仅只支持2维卷积，猜测2维卷积tf.nn.conv2d是对此接口的封装。[batch, height, weight, channel]就是conv2d的input参数格式，batch就是样本数，或者更狭隘一点，图片数量，height是图片高，weight是图片的宽，Slim的分类网络都是height=weight的，以实现方阵运算，所有slim模块中的原始图片都需要经过预处理过程，这里不展开。

filter参数是卷积核的定义，spatial_filter_shape + [in_channels, out_channels]，对于2维卷积同样是4维参数[weight, height, channel, out_channel]。

明明是2维卷积，输入都是4维，已经有点抽象了，所以进入下一个阶段，写段代码，验证一下吧。

实践一下

这个例子先定义一个3X3的图片，再定义一个2X2的卷积核，代码如下：

import tensorflow as tf

input = tf.constant(

[

        [

                [

                        [100., 100., 100.],

                        [100., 100., 100.],

                        [100., 100., 100.]

                ],

                [

                        [100., 100., 100.],

                        [100., 100., 100.],

                        [100., 100., 100.]

                ],

                [

                        [100., 100., 100.],

                        [100., 100., 100.],

                        [100., 100., 100.],

                ]

        ]

]

);

filter = tf.constant(

[

        [

                [

                        [0.5],

                        [0.5],

                        [0.5]

                ],

                [

                        [0.5],

                        [0.5],

                        [0.5]

                ]

        ],

        [

                [

                        [0.5],

                        [0.5],

                        [0.5]

                ],

                [

                        [0.5],

                        [0.5],

                        [0.5]

                ]

        ],

]

);

result = tf.nn.convolution(input, filter, padding='VALID');

with tf.Session() as sess:

        print sess.run(result)

从上述代码可以看到，input的shape是[1, 3, 3, 3]，filter的shape是[2, 2, 3, 1 ]，卷积的过程在方阵[3, 3] 和核[2, 2]上展开，并且由于有三个通道，每个通道分别卷积后求和。

代码的执行结果：

[

　　　　　　[600.]
　　　　　　[600.]

　　　　]

　　　　[

　　　　　　[600.]

　　　　]

由于我们填的padding参数是VALID，所以最后的结果矩阵面积会缩小，满足（3-2）+1，即 (iw - kw) + 1。

以上例子，我们可以将它称为单张图片的二维3通道卷积，所以计算过程应该是每个通道进行卷积后最后三个通道的数值累加。

如果是从单个通道看，input就是:

[

　　[100., 100., 100,]

]

卷积核：

[

　　[0.5, 0.5]

]

那么单层卷积结果：

[

　　[200., 200.]

]

将三层结果叠加就是程序输出结果。

增加输出通道

slim.conv2d函数的第二参数就是输出通道的数量，就是对应convolution接口filter的第4维，我们把程序改一下，增加一个输出通道：

filter = tf.constant(

[

        [

                [

                        [0.5, 0.1],

                        [0.5, 0.1],

                        [0.5, 0.1]

                ],

                [

                        [0.5, 0.1],

                        [0.5, 0.1],

                        [0.5, 0.1]

                ]

        ],

        [

                [

                        [0.5, 0.1],

                        [0.5, 0.1],

                        [0.5, 0.1]

                ],

                [

                        [0.5, 0.1],

                        [0.5, 0.1],

                        [0.5, 0.1]

                ]

        ],

]

);

最后的输出结果：

[

　　　　　　[600. 120.]
　　　　　　[600. 120.]

　　　　]
　　　　[

　　　　　　[600. 120.]
　　　　　　[600. 120.]

　　　　]

其中 120 = 3 * （100 * 0.1 + 100 * 0.1 + 100 * 0.1 + 100 * 0.1）

从结果可以看到，输出结果满足 [batch_size] + output_spatial_shape + [out_channels]的格式。

padding=SAME更常用

上面的例子中使用了padding=VALID，是指不填充的情况下进行的有效卷积结果矩阵面积会收缩。而我们在阅卷几个经典网络时，都是使用padding=SAME的方式，这种方式下，结果输出矩阵形状不变，这样就便于对不同分支结果进行连接等操作。

将第一个例子中的padding改为SAME，输出结果为:

[

　　　　　　[600.]
　　　　　　[600.]
　　　　　　[300.]

　　　　]
　　　　[

　　　　　　[600.]
　　　　　　[600.]
　　　　　　[300.]

　　　　]

　　　　[

　　　　　　[300.]
　　　　　　[300.]
　　　　　　[150.]

　　　　]

在SAME模式下，为了保证输出结果输入输入形状一致，实时上在原矩阵的的右侧和底部扩展了行、列 0

暂时性结束

作为新手，一旦碰到多维就蒙了，所有以上的实践，都是只是为了增加理解。

TensorFlow中的卷积函数的更多相关文章

TensorFlow 中的卷积网络
TensorFlow 中的卷积网络是时候看一下 TensorFlow 中的卷积神经网络的例子了. 网络的结构跟经典的 CNNs 结构一样,是卷积层,最大池化层和全链接层的混合. 这里你看到的代码与你 ...
【tensorflow基础】tensorflow中 tf.reduce_mean函数
参考 1. tensorflow中 tf.reduce_mean函数: 完
tensorflow中的卷积和池化层(一)
在官方tutorial的帮助下,我们已经使用了最简单的CNN用于Mnist的问题,而其实在这个过程中,主要的问题在于如何设置CNN网络,这和Caffe等框架的原理是一样的,但是tf的设置似乎更加简洁. ...
Tensorflow中的run()函数
1 run()函数存在的意义 run()函数可以让代码变得更加简洁,在搭建神经网络(一)中,经历了数据集准备.前向传播过程设计.损失函数及反向传播过程设计等三个过程,形成计算网络,再通过会话tf.Se ...
【转载】 tf.Print() （------------ tensorflow中的print函数）
原文地址: https://blog.csdn.net/weixin_36670529/article/details/100191674 ------------------------------ ...
tensorflow中 tf.reduce_mean函数
tf.reduce_mean 函数用于计算张量tensor沿着指定的数轴(tensor的某一维度)上的的平均值,主要用作降维或者计算tensor(图像)的平均值. reduce_mean(input_ ...
对于tensorflow中的gradient_override_map函数的理解
# #############添加############## def binarize(self, x): """ Clip and binarize tensor u ...
卷积运算的本质，以tensorflow中VALID卷积方式为例。
卷积运算在数学上是做矩阵点积,这样可以调整每个像素上的BGR值或HSV值来形成不同的特征.从代码上看,每次卷积核扫描完一个通道是做了一次四重循环.下面以VALID卷积方式为例进行解释. 下面是pyth ...
Tensorflow中的transpose函数解析
transpose函数作用是对矩阵进行转换操作相信说完上面这一句,大家和我一样都是懵逼状态,完全不知道是怎么回事,那么接下来和我一起探讨吧 1.二维数组 x = [[1,3,5], [2,4,6] ...

随机推荐

_viewstart.cshtml的作用
在ASP.NET MVC 3.0及更高版本中,用Razor模板引擎新建项目后,Views目录下会出现一个这样的文件:_ViewStart.cshtml. _viewstart.cshtml的作用 1. ...
基于PHP的cURL快速入门教程 (小偷采集程序)
cURL 是一个利用URL语法规定来传输文件和数据的工具,支持很多协议,如HTTP.FTP.TELNET等.很多小偷程序都是使用这个函数. 最爽的是,PHP也支持 cURL 库.本文将介绍 c ...
docker 不同版本添加--insecure-registry
docker 17.0.3 vim /lib/systemd/system/docker.service 然后重启 systemctl daemon-reload , systemctl rest ...
access数据库及其分页的方法
首先access数据库的话,感觉针对比较小型的网站比较适合.携带方便,不需要按照特定的sql环境. 当然如果使用access数据库的话 1.首先你先要下载办公五合一(access也是其中之一) 2.w ...
【转】Android 4.0 Launcher2源码分析——启动过程分析
Android的应用程序的入口定义在AndroidManifest.xml文件中可以找出:[html] <manifest xmlns:android="http://schemas. ...
.Net文档下载
public static void DownLoadFile(string fileName, HttpResponse Response, HttpServerUtility Server) { ...
使用Python编写简单网络爬虫抓取视频下载资源
我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎.所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题. Python一直是我主要使用的脚 ...
MacOS在Finder中建立快速新建txt的workflow
Mac是不支持右键直接新建txt的,因此有时候需要用到文本文稿的时候会比较麻烦. 因此这里提供一种个人认为比较方便的方法,让Mac也能很简洁的新建txt文件. 工具介绍: Automator ...
float浮动的一些基础常识
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
快速链接bioconductor，以及安装“XML”
options(useHTTPS=FALSE, BioC_mirror="http://bioconductor.org") source("http://biocond ...

TensorFlow中的卷积函数

前言