tensorflow中卷积、转置卷积具体实现方式

feihu_h 2024-09-01 23:59:13 原文

卷积和转置卷积，都涉及到padding, 那么添加padding 的具体方式，就会影响到计算结果，所以搞清除tensorflow中卷积和转置卷积的具体实现有助于模型的灵活部署应用。

一、卷积

举例说明：

　　　　X： 1 2 3 4 5

　　　　　　 6 7 8 9 10

　　　　　　11 12 13 14 15

　　　　　　16 17 18 19 20

　　　　　　21 22 23 24 25

　　　　w: 1 1 1 1

1 2 1 1

　　　　　　1 1 3 1

1 1 1 4

如对于：tf.nn.conv2(X,w,stride=[1,1],padding='SAME')

需要在X 中添加3 行 3列，那么在tensorflow 中的添加方式如下：

left_w = 3/2 up_h =3/2

right_w = 3-left_w down_h = 3- up_h

也即：添加padding 时如左右、上下不能呢个平均分配，则左边<=右边，上边<=下边

故，卷积后的（0，0）位置的值为， 1*2 + 2*1+ 3*1+ 6*1+7*3+8*1+11*1+12*1+14*4

二、转置卷积

X: 1 2 3 4 5 w: 1 1 1 1

　　6 7 8 9 10 1 2 1 1

　　11 12 13 14 15　　　　　 1 2 3 1

　　16 17 18 19 20

　　21 22 23 24 25

tf.nn.conv2d_transpose(X,W,tf.stack([10,10]),strides=[2,2],padding="SAME")

1、对X扩展,

strides=[2,2] 故扩展后的 X 为：（shape:10X10）

1 0 2 0 3 0 4 0 5 0

0 0 0 0 0 0 0 0 0 0

6 0 7 0 8 0 9 0 10 0

. . . . . . . . . .

. . . . . . . . . .

2、加padding,由于padding = "SAME" 所以需要加 3行 3列

对X 扩展再加padding 后的高和宽为：

H = X.H * stride + (w.H-1)

W = X.W*stride + (w.W-1)

l_h = ceil(((w.H - 1)*1.0 + (stride - 1)) / 2.0); // 向上取整数

l_h = l_h>(w.H - 1) ? (w.H - 1) : l_h; // 在左边添加padding 的列数

up_w = ceil(((w.W - 1)*1.0 + (stride - 1)) / 2.0) // 向上取整数

up_w = up_w>(w.W - 1) ? (w.W - 1) : up_h; // 在上边添加padding 的行数

说明：

input.shape： 5X5 ; stride = 3 ; w.shape =5*5 padding = "SAME" 时

扩展后，input.shape = 15*15 , 其中最右边扩展2列，最下边扩展2行

加padding后， input.shape = 19*19, 其中在最左边扩展3列，最上边扩展3行；最右边再扩展1列，最下边再扩展1行

卷积(步长为1)后， output .shape = 15*15

3、卷积

tensorflow 中conv2d_transpose对卷积的实现有别于conv2, 相当于将 w 进行reverse 后进行卷积。

tensorflow中卷积、转置卷积具体实现方式的更多相关文章

第十四节，TensorFlow中的反卷积，反池化操作以及gradients的使用
反卷积是指,通过测量输出和已知输入重构未知输入的过程.在神经网络中,反卷积过程并不具备学习的能力,仅仅是用于可视化一个已经训练好的卷积神经网络,没有学习训练的过程.反卷积有着许多特别的应用,一般可以用 ...
深度学习卷积网络中反卷积/转置卷积的理解 transposed conv/deconv
搞明白了卷积网络中所谓deconv到底是个什么东西后,不写下来怕又忘记,根据参考资料,加上我自己的理解,记录在这篇博客里. 先来规范表达为了方便理解,本文出现的举例情况都是2D矩阵卷积,卷积输入和核 ...
TensorFlow中tf.ConfigProto()配置Sesion运算方式
博主个人网站:https://chenzhen.online tf.configProto用于在创建Session的时候配置Session的运算方式,即使用GPU运算或CPU运算: 1. tf.Con ...
TensorFlow中CNN的两种padding方式“SAME”和“VALID”
来源 dilation_rate为一个可选的参数,默认为1,这里我们可以先不管它. 整理一下,对于"VALID",输出的形状计算如下: new_height=new_width=⌈ ...
由浅入深：CNN中卷积层与转置卷积层的关系
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由forrestlin发表于云+社区专栏导语:转置卷积层(Transpose Convolution Layer)又称反卷积层或分数卷 ...
tensorflow 卷积/反卷积-池化/反池化操作详解
Plese see this answer for a detailed example of how tf.nn.conv2d_backprop_input and tf.nn.conv2d_bac ...
TensorFlow中设置学习率的方式
目录 1. 指数衰减 2. 分段常数衰减 3. 自然指数衰减 4. 多项式衰减 5. 倒数衰减 6. 余弦衰减 6.1 标准余弦衰减 6.2 重启余弦衰减 6.3 线性余弦噪声 6.4 噪声余弦衰减 ...
TensorFlow中实现RNN，彻底弄懂time_step
这篇博客不是一篇讲解原理的博客,这篇博客主要讲解tnesorlfow的RNN代码结构,通过代码来学习RNN,以及讲解time_steps,如果这篇博客没有让你明白time_steps,欢迎博客下面评论 ...
Tensorflow中卷积的padding方式
根据tensorflow中的Conv2D函数,先定义几个基本符号: 输入矩阵W*W,这里只考虑输入宽高相等的情况,如果不相等,推导方法一样 filter矩阵F*F,卷积核 stride值S,步长输出 ...

随机推荐

java基础篇二
引言滴,第二天卡. 五.关键字 -static -初始化顺序 -静态变量和静态语句块优先于实例变量和普通语句块,静态变量和静态语句块的初始化顺序取决于它们在代 ...
深入解析Java反射
因为本人最近正筹备Samsara框架的开发,而其中的IOC部分非常依靠反射,因此趁这个机会来总结一下关于Java反射的一些知识.本篇为基本篇,基于JDK 1.8. 一.回顾:什么是反射? 反射(Ref ...
php5.4.16执行shell脚本
因为要用到Python脚本,所以打算直接在PHP中直接调用系统命令system(). 要注意两点: 一.PHP5.3以上不存在安全模式,即要直接执行脚本不需要作任何其他配置. 二.system函数格式 ...
如何在Sublime中打开左侧文件夹导航
Sublime中我们可以通过菜单栏的View->Side Bar->Hide Side Bar(Show Side Bar)来显示和隐藏左侧的导航栏,如下图所示. 但是,这里只会显示当前打 ...
return之为什么能够终止函数，代码演练
''' return 有终止函数的作用,下面通过执行到return x 以后, 就结束了程序的下一步执行,所以就没有往下面走,所以终端上也就只能看到打印结果100,看不到打印呢 ''' def se ...
.get的取值特点：.get只起到取值的作用不能对原值修改
#银行支付接口 def pay_interface(username,cost): user_dic=db_handler.select(username) if user_dic.get('bala ...
ES6对正则的改进(简要总结)
文章目录正则的扩展 1. RegExp 构造函数 2. 字符串的正则方法 3. u 修饰符 4. y 修饰符 5. sticky 属性 6. flags 属性 7. s 修饰符:dotAll 模式 ...
java对象的实例化过程
简单类对象的实例化过程 1.在方法区加载类: 2.在栈内存申请空间,声明变量P: 3.在堆内存中开辟空间,分配对象地址: 4.在对象空间中,对对象的属性进行默认初始化,类成员变量显示初始化: 5.构造 ...
Supermap/Cesium 开发心得----定位
SuperMap的WebGL是基于开源JS库Cesium做的修改而形成的产品,理论上用起来大同小异,如果在有不一样的地方再看,基本上还是与Cesium的接口名称和结构是一样的. 定位方法有基于Cesi ...
CODING 代码多仓库实践
关于代码的管理问题已经讨论多年,随着企业业务的复杂度提高.软件行业技术栈的选择度变宽泛,现代软件的代码仓库也变得越来越庞大和复杂.一个中型项目,将测试代码.核心业务代码.编译构建.部署打包等基础设施的 ...