在深度学习的图像识别领域中，我们经常使用卷积神经网络CNN来对图像进行特征提取，当我们使用TensorFlow搭建自己的CNN时，一般会使用TensorFlow中的卷积函数和池化函数来对图像进行卷积和池化操作，而这两种函数中都存在参数padding，该参数的设置很容易引起错误，所以在此总结下。

1.为什么要使用padding

在弄懂padding规则前得先了解拥有padding参数的函数，在TensorFlow中，主要使用tf.nn.conv2d()进行（二维数据）卷积操作，tf.nn.max_pool()、tf.nn.avg_pool来分别实现最大池化和平均池化，通过查阅官方文档我们知道其需要的参数如下：

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None,name=None)

tf.nn.max_pool_with_argmax(input, ksize, strides, padding, Targmax=None, name=None)

tf.nn.max_pool(value, ksize, strides, padding, name=None)

这三个函数中都含有padding参数，我们在使用它们的时候需要传入所需的值，padding的值为字符串，可选值为'SAME' 和 'VALID' ；

padding参数的作用是决定在进行卷积或池化操作时，是否对输入的图像矩阵边缘补0，'SAME' 为补零，'VALID' 则不补，其原因是因为在这些操作过程中过滤器可能不能将某个方向上的数据刚好处理完，如下所示：

当步长为5，卷积核尺寸为6×6时，当padding为VALID时，则可能造成数据丢失（如左图），当padding为SAME时，则对其进行补零（如右图），

2. padding公式

首先，定义变量：

输入图片的宽和高：i_w 和 i_h

输出特征图的宽和高：o_w 和 o_h

过滤器的宽和高：f_w 和 f_h

宽和高方向的步长：s_w 和 s_h

宽和高方向总的补零个数：pad_w 和 pad_h

顶部和底部的补零个数：pad_top 和 pad_bottom

左部和右部的补零个数：pad_left 和 pad_right

1.VALID模式

输出的宽和高为

o_w = （i_w - f_w + 1）/ s_w #（结果向上取整）

o_h = （i_h - f_h + 1）/ s_h  #（结果向上取整）

2. SAME模式

输出的宽和高为

o_w = i_w / s_w#（结果向上取整）

o_h = i_h / s_h#（结果向上取整）

各个方向的补零个数为：max()为取较大值，

pad_h = max（( o_h -1 ) × s_h + f_h - i_h ， 0）

 pad_top = pad_h / 2  # 注意此处向下取整

 pad_bottom = pad_h - pad_top

 pad_w = max（( o_w -1 ) × s_w + f_w - i_w ， 0）

 pad_left = pad_w / 2 # 注意此处向下取整

 pad_right = pad_w - pad_left

3.卷积padding的实战分析

接下来我们通过在TensorFlow中使用卷积和池化函数来分析padding参数在实际中的应用，代码如下：

# -*- coding: utf-8 -*-

import tensorflow as tf

# 首先，模拟输入一个图像矩阵，大小为5*5

# 输入图像矩阵的shape为[批次大小，图像的高度，图像的宽度，图像的通道数]

input = tf.Variable(tf.constant(1.0, shape=[1, 5, 5, 1]))

# 定义卷积核，大小为2*2，输入和输出都是单通道

# 卷积核的shape为[卷积核的高度，卷积核的宽度，图像通道数，卷积核的个数]

filter1 = tf.Variable(tf.constant([-1.0, 0, 0, -1], shape=[2, 2, 1, 1]))

# 卷积操作 strides为[批次大小，高度方向的移动步长，宽度方向的移动步长，通道数]

# SAME

op1_conv_same = tf.nn.conv2d(input, filter1, strides=[1,2,2,1],padding='SAME')

# VALID

op2_conv_valid = tf.nn.conv2d(input, filter1, strides=[1,2,2,1],padding='VALID')

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    print("op1_conv_same:\n", sess.run(op1_conv_same))

    print("op2_conv_valid:\n", sess.run(op2_conv_valid))

VALID模式的分析：

SAME模式分析：

o_w = i_w  / s_w = 5/2 = 3

o_h = i_h / s_h = 5/2 = 3

pad_w = max ( (o_w - 1 ) × s_w + f_w -  i_w , 0 )

      =  max ( (3 - 1 ) × 2 + 2 - 5 , 0 )  = 1

pad_left = 1 / 2 =0

pad_right = 1 - 0 =0

# 同理

pad_top = 0

pad_bottom = 1

运行代码后的结果如下：

4.池化padding的实战分析

这里主要分析最大池化和平均池化两个函数，函数中padding参数设置和矩阵形状计算都与卷积一样，但需要注意的是：

1. 当padding='SAME'，计算avg_pool时，每次的计算是除以图像被filter框出的非零元素的个数，而不是filter元素的个数，如下图，第一行第三列我们计算出的结果是除以2而非4，第三行第三列计算出的结果是除以1而非4；

2. 当计算全局池化时，即与图像矩阵形状相同的过滤器进行一次池化，此情况下无padding，即在边缘没有补0，我们直接除以整个矩阵的元素个数，而不是除以非零元素个数（注意与第一点进行区分）

池化函数的代码示例如下：

# -*- coding: utf-8 -*-

import tensorflow as tf

# 首先，模拟输入一个特征图，大小为5*5

# 输入图像矩阵的shape为[批次大小，图像的高度，图像的宽度，图像的通道数]

input = tf.Variable(tf.constant(1.0, shape=[1, 5, 5, 1]))

# 最大池化操作 strides为[批次大小，高度方向的移动步长，宽度方向的移动步长，通道数]

# ksize为[1, 池化窗口的高，池化窗口的宽度，1]

# SAME

op1_max_pooling_same = tf.nn.max_pool(input, [1,2,2,1], strides=[1,2,2,1],padding='SAME')

# VALID

op2_max_pooling_valid = tf.nn.max_pool(input, [1,2,2,1], strides=[1,2,2,1],padding='VALID')

# 平均池化

op3_avg_pooling_same = tf.nn.avg_pool(input, [1,2,2,1], strides=[1,2,2,1],padding='SAME')

# 全局池化，filter是一个与输入矩阵一样大的过滤器

op4_global_pooling_same = tf.nn.avg_pool(input, [1,5,5,1], strides=[1,5,5,1],padding='SAME')

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    print("op1_max_pooling_same:\n", sess.run(op1_max_pooling_same))

    print("op2_max_pooling_valid:\n", sess.run(op2_max_pooling_valid))

    print("op3_max_pooling_same:\n", sess.run(op3_avg_pooling_same))

    print("op4_global_pooling_same:\n", sess.run(op4_global_pooling_same))

运行结果如下：

5.总结

在搭建CNN时，我们输入的图像矩阵在网络中需要经过多层卷积和池化操作，在这个过程中，feature map的形状会不断变化，如果不清楚padding参数引起的这些变化，程序在运行过程中会发生错误，当然在实际写代码时，可以将每一层feature map的形状打印出来，了解每一层Tensor的变化。

转载请注明出处：https://www.cnblogs.com/White-xzx/p/9497029.html

【TensorFlow】一文弄懂CNN中的padding参数的更多相关文章

一文弄懂神经网络中的反向传播法——BackPropagation【转】
本文转载自:https://www.cnblogs.com/charlotte77/p/5629865.html 一文弄懂神经网络中的反向传播法——BackPropagation 最近在看深度学习 ...
基于TensorFlow理解CNN中的padding参数
1 TensorFlow中用到padding的地方在TensorFlow中用到padding的地方主要有tf.nn.conv2d(),tf.nn.max_pool(),tf.nn.avg_pool( ...
[转] 一文弄懂神经网络中的反向传播法——BackPropagation
在看CNN和RNN的相关算法TF实现,总感觉有些细枝末节理解不到位,浮在表面.那么就一点点扣细节吧. 这个作者讲方向传播也是没谁了,666- 原文地址:https://www.cnblogs.com/ ...
一文弄懂神经网络中的反向传播法——BackPropagation
最近在看深度学习的东西,一开始看的吴恩达的UFLDL教程,有中文版就直接看了,后来发现有些地方总是不是很明确,又去看英文版,然后又找了些资料看,才发现,中文版的译者在翻译的时候会对省略的公式推导过程进 ...
一文弄懂神经网络中的反向传播法(Backpropagation algorithm)
最近在看深度学习的东西,一开始看的吴恩达的UFLDL教程,有中文版就直接看了,后来发现有些地方总是不是很明确,又去看英文版,然后又找了些资料看,才发现,中文版的译者在翻译的时候会对省略的公式推导过程进 ...
彻底弄懂AngularJS中的transclusion
点击查看AngularJS系列目录彻底弄懂AngularJS中的transclusion AngularJS中指令的重要性是不言而喻的,指令让我们可以创建自己的HTML标记,它将自定义元素变成了一个 ...
一文弄懂-Netty核心功能及线程模型
目录一. Netty是什么? 二. Netty 的使用场景三. Netty通讯示例 1. Netty的maven依赖 2. 服务端代码 3. 客户端代码四. Netty线程模型五. Netty ...
一文弄懂-《Scalable IO In Java》
目录一. <Scalable IO In Java> 是什么? 二. IO架构的演变历程 1. Classic Service Designs 经典服务模型 2. Event-drive ...
一文弄懂-BIO,NIO,AIO
目录一文弄懂-BIO,NIO,AIO 1. BIO: 同步阻塞IO模型 2. NIO: 同步非阻塞IO模型(多路复用) 3.Epoll函数详解 4.Redis线程模型 5. AIO: 异步非阻塞IO ...

随机推荐

shell 变量定义使用
shell 中变量的几种类型: 1.局部变量:只在当前 shell 可用的变量, 2.环境变量:当前 shell 的子进程也可用的变量 3.shell 变量:一些由 shell 设置的特殊变量,如:$ ...
linux driver ------ 交叉工具链（cross toolchain）
在 ARM Linux 的开发中,人们趋向于使用 Linaro(http://www.linaro.org/)工具链团队维护的 ARM 工具链,它以每月一次的形式发布新的版本,编译好的可执行文件可以网 ...
Java Socket Timeout 总结
原文出处:囚兔摘要: Java的网络编程Socket常常用于各种网络工具,比如数据库的jdbc客户端,redis客户端jedis,各种RPC工具java客户端,这其中存在一些参数来配置timeout ...
python中的关键字符
from keyword import kwlistprint(kwlist)for i in kwlist: print(i) 可以显示所有的关键字符,开发者不要重新赋予其他值. a = 10000 ...
SourceTree使用SSH克隆码云项目
SourceTree使用SSH克隆码云项目觉得有用的话,欢迎一起讨论相互学习~Follow Me SourceTree使用SSH克隆码云项目参考文献 https://blog.csdn.net/q ...
Linux系统中连接使用NAS
在使用NAS时,需要先确定NAS上的NFS服务和SMB的服务都开启了: 然后需要用NAS上的用户去登录,这里用的是admin: # smbclient -L 192.168.1.40 -U admin ...
织梦自定义表单通过ajax提交的实现方法
自定义表单通过ajax判断,提交不用跳转页面,提高用户体验.具体方法如下: html表单代码部分,就提交按钮改成botton,,添加onclick事件表单代码: <form action=&q ...
urllib模块和urllib2模块的区别
一开始我以为urllib2模块单纯是urllib模块的升级版,因为我看到它们都有urlopen方法,但是经过查找资料,发现两者差别还是很大的. 这是我在网上看到的总结: urllib2可以接受一个Re ...
20155223 2016-2017-2 《Java程序设计》第7周学习总结
20155223 2016-2017-2 <Java程序设计>第7周学习总结教材学习内容总结第十二章 Lambdo表达式下,任何参数的类型必须标明清楚:如果有目标类型的话,在编译程序可 ...
浅谈iOS与社交化网络
CHENYILONG Blog 社交化网络技术博客http://www.cnblogs.com/ChenYilong/ 新浪微博http://weibo.com/luohanchenyilong ...

【TensorFlow】一文弄懂CNN中的padding参数