记录：TensorFlow 中的 padding 方式

TensorFlow 中卷积操作和池化操作中都有一个参数 padding，其可选值有 ['VALID', 'SAME']。

在 TensorFlow 文档中只是给出了输出张量的维度计算方式，但是并没有说明当 padding='SAME' 时，如何进行补零操作。

其给出的输出张量的维度计算公式：

VALID 方式：

output_shape[i] = ceil((input_shape[i] - (filter_shape[i] - 1) * dilation_rate[i]) / strides[i])

# 但实际上几乎不会去管 dilation_rate 参数，都是 1，于是

output_shape[i] = ceil((input_shape[i] - filter_shape[i] + 1) / strides[i])

# 上式也是常见的

output_shape[i] = floor((input_shape[i] - filter_shape[i]) / strides[i]) + 1

# 一般我们只对图像平面上做卷积和池化，也就是一般 i 指的是图像平面上的 height 和 width

SAME 方式：

output_shape[i] = ceil(input_shape[i] / strides[i])

VALID 方式其实是很好理解的，主要是 SAME 的 padding 方式，应该怎么样补零？

假设输入的张量平面上是 W×W 的矩阵，不考虑 batch 和 channel 这两个维度；filter 是 w×w 的矩阵；strides=[s, s]。暂时考虑在第 0 轴上，设需要补零的列数为 x，易知我们进行补零操作后，执行的就是以 VALID 方式进行的卷积，而且卷积后该矩阵的 shape=[new_W, new_W]，所以：

floor((W + x - w) / s) + 1 = new_W

因为 floor 是向下取整，所以：

0 ≤ (W + x - w) / s - (new_W - 1) < 1

由简单的不等式可以求出：

(s * (new_W - 1) + w - W) ≤ x < (s * new_W + w - W)

但实际上只要是按照 VALID 方式进行卷积，那多余的行或者列必然是被丢弃的，所以 x 取最小值就行。如果得到 min(x) = 3，那应该怎么补零呢？当需要补零的列（还是只在第 0 轴考虑，因为第 1 轴上情况完全相同）数为 x 时，需要补零的列数为：

padding_for_left = |x / 2| (向下取整操作)，padding_for_right = x - padding_for_left。涉及到上下时（也就是考虑高度方向时），把 left 换成 top，right 换成 bottom 即可。

下面使用一点代码片段来验证一下：

import numpy as np

import tensorflow as tf

input_7 = tf.constant([[1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7],

                                 [2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7],

                                 [3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7],

                                 [4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7],

                                 [5.1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7],

                                 [6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7],

                                 [7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7]])  

input_7 = tf.reshape(input_7, [1, 7, 7, 1])

filter =   tf.constant(np.ones([4, 4, 1, 1]), dtype=tf.float32)

stride = [1, 3, 3, 1]

conv_output = tf.nn.conv2d(input_7, filter=filter, strides=stride, padding='SAME')

with tf.Session() as sess:

    output = sess.run(conv_output)

    shape = output.shape[1], output.shape[2]

    print(output.reshape(shape))

# 本测试中，W=7, s=3, w=4

上述代码输出结果为：

[[19.8      29.4      15.9     ]

 [56.4      79.200005 41.199997]

 [40.2      55.600002 28.599998]]

这里计算出来的需要补零的列数为 3，如果简单的计算一下就可以知道在上边界和左边界分别补零一次，右边界和下边界补零两次（一次表示一行或者一列）。

而且通过计算可以看出，TensorFlow 是真的在进行补零，而不是边界复制或者镜像，更不是块复制，不是很明白为什么不进行边界复制，边界复制不是更好吗？

另外，池化过程和卷积操作有点区别，那就是卷积的 padding 是进行补零操作，但是池化并不是补零，而是补 -inf，-inf 表示负无穷大。为什么这样补值呢？因为我们的输出靠近边界的那些行或者列并不可能全是正数，也可能存在负数，但是负数是有意义的，是我们的网络提取出来的有意义的值，如果补零，那么就会丢失这些细节信息，所以补 -inf 保证这些信息能保留下来。

记录：TensorFlow 中的 padding 方式的更多相关文章

Tensorflow中的padding操作
转载请注明出处:http://www.cnblogs.com/willnote/p/6746668.html 图示说明用一个3x3的网格在一个28x28的图像上做切片并移动移动到边缘上的时候,如果 ...
Tensorflow中使用tfrecord方式读取数据-深度学习-周振洋
本博客默认读者对神经网络与Tensorflow有一定了解,对其中的一些术语不再做具体解释.并且本博客主要以图片数据为例进行介绍,如有错误,敬请斧正. 使用Tensorflow训练神经网络时,我们可以用 ...
卷积运算的本质，以tensorflow中VALID卷积方式为例。
卷积运算在数学上是做矩阵点积,这样可以调整每个像素上的BGR值或HSV值来形成不同的特征.从代码上看,每次卷积核扫描完一个通道是做了一次四重循环.下面以VALID卷积方式为例进行解释. 下面是pyth ...
tensorflow中卷积、转置卷积具体实现方式
卷积和转置卷积,都涉及到padding, 那么添加padding 的具体方式,就会影响到计算结果,所以搞清除tensorflow中卷积和转置卷积的具体实现有助于模型的灵活部署应用. 一.卷积举例说明 ...
Tensorflow中卷积的padding方式
根据tensorflow中的Conv2D函数,先定义几个基本符号: 输入矩阵W*W,这里只考虑输入宽高相等的情况,如果不相等,推导方法一样 filter矩阵F*F,卷积核 stride值S,步长输出 ...
【TensorFlow】一文弄懂CNN中的padding参数
在深度学习的图像识别领域中,我们经常使用卷积神经网络CNN来对图像进行特征提取,当我们使用TensorFlow搭建自己的CNN时,一般会使用TensorFlow中的卷积函数和池化函数来对图像进行卷积和 ...
TensorFlow中设置学习率的方式
目录 1. 指数衰减 2. 分段常数衰减 3. 自然指数衰减 4. 多项式衰减 5. 倒数衰减 6. 余弦衰减 6.1 标准余弦衰减 6.2 重启余弦衰减 6.3 线性余弦噪声 6.4 噪声余弦衰减 ...
【转载】 Tensorflow中padding的两种类型SAME和VALID
原文地址: https://blog.csdn.net/jasonzzj/article/details/53930074 -------------------------------------- ...
记录Linq中lambda动态表达式的使用方式
项目中有的时候我们会用到动态表达式的方式去查询数据,这里简单记录下个人的使用方式,方便使用↓ //构建参数表达式 ParameterExpression parameter = Expression. ...

随机推荐

C#读取AD域用户信息
private const string domainName = "本机IP地址或域名"; private const string adAdmin = "管理员帐号& ...
tomcat 闪退处理
参考文章:https://www.cnblogs.com/lanjianhappy/p/6491436.html 首先确保JDK环境变量已经配置好! 设置jdk环境变量:https://jingya ...
Resource View Window of Visual Studio
https://msdn.microsoft.com/en-us/library/d4cfawwc.aspx For the latest documentation on Visual Studio ...
看代码网备份|利用WebClient|eKing.CmdDownLoadDbBakOper|实现定时拷贝数据库备份文件到文件服务器
摘要: 1.有两台服务器 (1)看代码网(记为A):内网IP:10.186.73.30 (2)文件服务器(记为B):内网IP:10.135.87.157 2.在A架设一个网站,端口8088(防火强设置 ...
win10桌面显示我的电脑设置
首先,我们可以看到桌面上面没有我的电脑. 我们在桌面空白处点击右键,选择“个性化”. 然后选择“更改桌面图标”,如图示. 在如图示位置,将“计算机”勾选,然后点击“应用”--" ...
Django商城项目笔记No.7用户部分-注册接口-判断用户名和手机号是否存在
Django商城项目笔记No.7用户部分-注册接口-判断用户名和手机号是否存在判断用户名是否存在后端视图代码实现,在users/view.py里编写如下代码 class UsernameCount ...
python第三十一课－－递归(3.递归的弊端)
演示递归的弊端: def mySum(num): if num == 1: return 1 return num+mySum(num-1) mySum(998) [注意]:递归可以解决绝大多数循环能 ...
BZOJ1007:[HNOI2008]水平可见直线(计算几何)
Description 在xoy直角坐标平面上有n条直线L1,L2,...Ln,若在y值为正无穷大处往下看,能见到Li的某个子线段,则称Li为可见的,否则Li为被覆盖的. 例如,对于直线: L1:y ...
Node.js实战(七)之交互式解释器
Node.js REPL(Read Eval Print Loop:交互式解释器) 表示一个电脑的环境,类似 Window 系统的终端或 Unix/Linux shell,我们可以在终端中输入命令,并 ...
Dubbo -- 系统学习笔记 -- 配置
Dubbo -- 系统学习笔记 -- 目录配置 Xml配置属性配置注解配置 API配置配置 Xml配置配置项说明 :详细配置项,请参见:配置参考手册 API使用说明 : 如果不想使用Spr ...

记录：TensorFlow 中的 padding 方式

记录：TensorFlow 中的 padding 方式的更多相关文章

随机推荐

热门专题