作者：凌逆战

地址：https://www.cnblogs.com/LXP-Never/p/10763804.html

在看这两个函数之前，我们需要先了解一维卷积(conv1d)和二维卷积(conv2d)，二维卷积是将一个特征图在width和height两个方向进行滑动窗口操作，对应位置进行相乘求和；而一维卷积则只是在width或者height方向上进行滑动窗口并相乘求和。

一维卷积：tf.layers.conv1d()

一维卷积常用于序列数据，如自然语言处理领域。

tf.layers.conv1d(

    inputs,

    filters,

    kernel_size,

    strides=1,

    padding='valid',

    data_format='channels_last',

    dilation_rate=1,

    activation=None,

    use_bias=True,

    kernel_initializer=None,

    bias_initializer=tf.zeros_initializer(),

    kernel_regularizer=None,

    bias_regularizer=None,

    activity_regularizer=None,

    kernel_constraint=None,

    bias_constraint=None,

    trainable=True,

    name=None,

    reuse=None

)

参数：^[1]

inputs：张量数据输入，一般是[batch, width, length]
filters：整数，输出空间的维度，可以理解为卷积核_(滤波器)的个数
kernel_size：单个整数或元组/列表，指定1D_{(一维，一行或者一列)}卷积窗口的长度。
strides：单个整数或元组/列表，指定卷积的步长，默认为1
padding："SAME" or "VALID" _{(不区分大小写)}是否用0填充，
- - SAME用0填充；
  - VALID不使用0填充，舍去不匹配的多余项。
activation：激活函数
ues_bias：该层是否使用偏差
kernel_initializer：卷积核的初始化
bias_initializer：偏置向量的初始化器
kernel_regularizer：卷积核的正则化项
bias_regularizer：偏置的正则化项
activity_regularizer：输出的正则化函数
reuse：Boolean，是否使用相同名称重用前一层的权重
trainable：Boolean，如果True，将变量添加到图collection中
data_format：一个字符串，一个channels_last（默认）或channels_first。输入中维度的排序。
- - channels_last：对应于形状的输入(batch, length, channels)
  - channels_first：对应于形状输入(batch, channels, length)
name = 取一个名字

返回值：

　　一维卷积后的张量，

例子

import tensorflow as tf 

x = tf.get_variable(name="x", shape=[32, 512, 1024], initializer=tf.zeros_initializer)

x = tf.layers.conv1d(

    x,

    filters=1,                    # 输出的第三个通道是1

    kernel_size=512,            # 不用管它是多大，都不影响输出的shape

    strides=1,

    padding='same',

    data_format='channels_last',

    dilation_rate=1,

    use_bias=True,

    bias_initializer=tf.zeros_initializer())

print(x)            # Tensor("conv1d/BiasAdd:0", shape=(32, 512, 1), dtype=float32)

解析：

输入数据的维度为[batch, data_length, data_width]=[32, 512, 1024]，一般输入数据input第一维为batch_size，此处为32，意味着有32个样本，第二维度和第三维度分别表示输入的长和宽（512，1024）
一维卷积核是二维的，也有长和宽，长为卷积核的数量kernel_size=512，因为卷积核的数量只有一个，所以宽为输入数据的宽度data_width=1024，所以一维卷积核的shape为[512,1024]
filteres是卷积核的个数，即输出数据的第三维度。filteres=1，第三维度为1
所以卷积后的输出数据大小为[32, 512, 1]

二维卷积：tf.layers.conv2d()

二维卷积常用于计算机视觉、图像处理领域

tf.layers.conv2d(

    inputs,

    filters,

    kernel_size,

    strides=(1, 1),

    padding='valid',

    data_format='channels_last',

    dilation_rate=(1, 1),

    activation=None,

    use_bias=True,

    kernel_initializer=None,

    bias_initializer=tf.zeros_initializer(),

    kernel_regularizer=None,

    bias_regularizer=None,

    activity_regularizer=None,

    kernel_constraint=None,

    bias_constraint=None,

    trainable=True,

    name=None,

    reuse=None

)

参数：^[4]

inputs：张量输入。一般是[batch, width, length，channel]
filters：整数，输出空间的维度，可以理解为卷积核_(滤波器)的个数
kernel_size：2个整数或元组/列表，指定2D卷积窗口的高度和宽度。可以是单个整数，以指定所有空间维度的相同值。
strides：2个整数或元组/列表，指定卷积沿高度和宽度方向的步幅。可以是单个整数，以指定所有空间维度的相同值。
padding："SAME" or "VALID" _{(不区分大小写)}是否用0填充，
- - SAME用0填充；
  - VALID不使用0填充，舍去不匹配的多余项。
data_format：字符串，"channels_last"（默认）或"channels_first"。输入中维度的排序。
- - channels_last：对应于具有形状的输入，(batch, height, width, channels)
  - channels_first：对应于具有形状的输入(batch, channels, height, width)
activation：激活函数
use_bias：Boolean，该层是否使用偏差项
kernel_initializer：卷积核的初始化
bias_initializer：偏置向量的初始化。如果为None，将使用默认初始值设定项
kernel_regularizer：卷积核的正则化项
bias_regularizer：偏置矢量的正则化项
activity_regularizer：输出的正则化函数
trainable：Boolean，如果True，将变量添加到图collection中
name：图层的name
reuse：Boolean，是否使用相同名称重用前一层的权重

　　二维卷积后的张量

例子：

import tensorflow as tf 

x = tf.get_variable(name="x", shape=[1, 3, 3, 5], initializer=tf.zeros_initializer)

x = tf.layers.conv2d(

    x,

    filters=1,                    # 结果的第三个通道是1

    kernel_size=[1, 1],            # 不用管它是多大，都不影响输出的shape

    strides=[1, 1],

    padding='same',

    data_format='channels_last',

    use_bias=True,

    bias_initializer=tf.zeros_initializer())

print(x)            # shape=(1, 3, 3, 1)

解析：

input输入是1张 3*3 大小的图片，图像通道数是5，输入shape=(batch, data_length， data_width， data_channel）
kernel_size卷积核shape是 1*1，数量filters是1strides步长是[1,1]，第一维和第二维分别为长度方向和宽度方向的步长 = 1。
最后输出的shape为[1,3,3,1] 的张量，即得到一个3*3的feature map（batch，长，宽，输出通道数）
长和宽只和strides有关，最后一个维度 = filters。

卷积层中的输出大小计算

　　设输入图片大小W，Filter大小F*F，步长为S，padding为P，输出图片的大小为N：

$$N=\frac{W-F+2P}{S}+1$$

　　向下取整后再加1。

在Tensoflow中，Padding有2个选型，'SAME'和'VALID' ，下面举例说明差别：

如果 Padding='SAME'，输出尺寸为： W / S_{（向上取整）}

import tensorflow as tf

input_image = tf.get_variable(shape=[64, 32, 32, 3], dtype=tf.float32, name="input", initializer=tf.zeros_initializer)

conv0 = tf.layers.conv2d(input_image, 64, kernel_size=[3, 3], strides=[2, 2], padding='same')  # 32/2=16

conv1 = tf.layers.conv2d(input_image, 64, kernel_size=[5, 5], strides=[2, 2], padding='same')

# kernel_szie不影响输出尺寸

print(conv0)      # shape=(64, 16, 16, 64)

print(conv1)      # shape=(64, 16, 16, 64)

如果 Padding='VALID'，输出尺寸为：(W - F + 1) / S

import tensorflow as tf

input_image = tf.get_variable(shape=[64, 32, 32, 3], dtype=tf.float32, name="input", initializer=tf.zeros_initializer)

conv0 = tf.layers.conv2d(input_image, 64, kernel_size=[3, 3], strides=[2, 2], padding='valid')  # (32-3+1)/2=15

conv1 = tf.layers.conv2d(input_image, 64, kernel_size=[5, 5], strides=[2, 2], padding='valid')  # (32-5+1)/2=14

print(conv0)      # shape=(64, 15, 15, 64)

print(conv1)      # shape=(64, 14, 14, 64)

1x1卷积核的作用，加深一层网络，提取更深特征，数据变维，

有效卷积(valid)、同维卷积(same)、完全卷积(full)

a = [1 2 3 4 5] 原数组
b = [8 7 6] 　　卷积核数组 kernel

使用b作为卷积核对a数组做一维卷积运算的过程如下：

原数组：   0  0  1  2  3  4  5  0  0

卷积数组： 6  7  8

            6  7  8

               6  7  8

                  6  7  8

                     6  7  8

                        6  7  8

                           6  7  8

-------------------------------------

结果：        44 65  86         有效卷积 (valid)

          23 44 65  86 59      同维卷积 (same)

      8   23 44 65  86 59 30   完全卷积 (full)

参考文献：

[1] tensorflow官方API tf.layers.conv1d

[2] tf.layers.conv1d函数解析（一维卷积）

[3] tf.layer.conv1d、conv2d、conv3d

[4] tensorflow官方API tf.layers.conv2d

import tensorflow as tf

# case 2

input = tf.Variable(tf.random_normal([1, 3, 3, 5]))

filter = tf.Variable(tf.random_normal([1, 1, 5, 1]))

op2 = tf.nn.conv2d(input, filter, strides=[1, 1, 1, 1], padding='VALID')  # (1, 3, 3, 1)

# case 3

input = tf.Variable(tf.random_normal([1, 3, 3, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 1]))

op3 = tf.nn.conv2d(input, filter, strides=[1, 1, 1, 1], padding='VALID')  # (1, 1, 1, 1)

# case 4

input = tf.Variable(tf.random_normal([1, 5, 5, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 1]))

op4 = tf.nn.conv2d(input, filter, strides=[1, 1, 1, 1], padding='VALID')  # (1, 3, 3, 1)

# case 5

input = tf.Variable(tf.random_normal([1, 5, 5, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 1]))

op5 = tf.nn.conv2d(input, filter, strides=[1, 1, 1, 1], padding='SAME')  # (1, 5, 5, 1)

# case 6

input = tf.Variable(tf.random_normal([1, 5, 5, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 7]))

op6 = tf.nn.conv2d(input, filter, strides=[1, 1, 1, 1], padding='SAME')  # (1, 5, 5, 7)

# case 7

input = tf.Variable(tf.random_normal([1, 5, 5, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 7]))

op7 = tf.nn.conv2d(input, filter, strides=[1, 2, 2, 1], padding='SAME')  # (1, 3, 3, 7)

# case 8

input = tf.Variable(tf.random_normal([10, 5, 5, 5]))

filter = tf.Variable(tf.random_normal([3, 3, 5, 7]))

op8 = tf.nn.conv2d(input, filter, strides=[1, 2, 2, 1], padding='SAME')  # (10, 3, 3, 7)

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    print("case 2")

    print(sess.run(op2).shape)  # (1, 3, 3, 1)

    print("case 3")

    print(sess.run(op3).shape)  # (1, 1, 1, 1)

    print("case 4")

    print(sess.run(op4).shape)  # (1, 3, 3, 1)

    print("case 5")

    print(sess.run(op5).shape)  # (1, 5, 5, 1)

    print("case 6")

    print(sess.run(op6).shape)  # (1, 5, 5, 7)

    print("case 7")

    print(sess.run(op7).shape)  # (1, 3, 3, 7)

    print("case 8")

    print(sess.run(op8).shape)  # (10, 3, 3, 7)

CNN神经网络之卷积操作的更多相关文章

CNN中的卷积操作的参数数计算
之前一直以为卷积是二维的操作,而到今天才发现卷积其实是在volume上的卷积.比如输入的数据是channels*height*width(3*10*10),我们定义一个核函数大小为3*3,则输出是8* ...
（原）CNN中的卷积、1x1卷积及在pytorch中的验证
转载请注明处处: http://www.cnblogs.com/darkknightzh/p/9017854.html 参考网址: https://pytorch.org/docs/stable/nn ...
比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？
CNN卷积神经网络问世以来,在计算机视觉领域备受青睐,与传统的神经网络相比,其参数共享性和平移不变性,使得对于图像的处理十分友好,然而,近日由Facebook AI.新家坡国立大学.360人工智能研究 ...
深度学习原理与框架-Tensorflow卷积神经网络-卷积神经网络mnist分类 1.tf.nn.conv2d(卷积操作) 2.tf.nn.max_pool(最大池化操作) 3.tf.nn.dropout(执行dropout操作) 4.tf.nn.softmax_cross_entropy_with_logits(交叉熵损失) 5.tf.truncated_normal(两个标准差内的正态分布)
1. tf.nn.conv2d(x, w, strides=[1, 1, 1, 1], padding='SAME') # 对数据进行卷积操作参数说明:x表示输入数据,w表示卷积核, stride ...
卷积神经网络（CNN）中卷积的实现
卷积运算本质上就是在滤波器和输入数据的局部区域间做点积,最直观明了的方法就是用滑窗的方式,c++简单实现如下: 输入:imput[IC][IH][IW] IC = input.channels IH ...
神经网络6_CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)概念区分理解
sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程,QQ:231469242) https://study.163.com/course/introduction.htm?courseId ...
CNN中各类卷积总结：残差、shuffle、空洞卷积、变形卷积核、可分离卷积等
CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量.我下面会对近几年一些具有变革性的工作进行简单盘点,从这些充满革新性的工作中 ...
Inception模型和Residual模型卷积操作的keras实现
Inception模型和Residual残差模型是卷积神经网络中对卷积升级的两个操作. 一. Inception模型(by google) 这个模型的trick是将大卷积核变成小卷积核,将多个卷积核 ...
[转]CNN 中千奇百怪的卷积方式大汇总
https://www.leiphone.com/news/201709/AzBc9Sg44fs57hyY.html 推荐另一篇很好的总结:变形卷积核.可分离卷积?卷积神经网络中十大拍案叫绝的操作. ...

随机推荐

WPF Aero Glass Window
原文:WPF Aero Glass Window 用法 Win7 DwmSetWindowAttribute function Win10 SetWindowCompositionAttribute ...
new和delete必须成对出现吗？【网上集合贴+个人总结】
new和delete必须成对出现吗?[网上集合贴+个人总结] 1.从内存泄露与否的角度考虑 new 和 delete不一定要成对出現.理论上是這樣的.但是从习惯上來說,new delete成對出現是一 ...
window8 飘带与页面切换效果
演示效果如下用鼠标点击滑动试试就能看到效果了 ^_^ iscroll 不仅可以做到自然滚动条的效果,看官方文档还可以用来做页面切换的效果,很好很强大. 所以我结合流行的飘带元素做了个简单的例子.. ...
海康威视频监控设备Web查看系统（三）：Web篇
声明:本系列文章只提供交流与学习使用.文章中所有涉及到海康威视设备的SDK均可在海康威视官方网站下载得到.文章中所有除官方SDK以为的代码均可随意使用,任何涉及到海康威视公司利益的非正常使用由使用者自 ...
win7访问部分win2003速度慢
解决办法: 关闭TCPIP协议的自动优化调整功能,在win7上,以管理员身份运行cmd,输入 netsh interface tcp set global autotuninglevel=disabl ...
Mysql 自定义HASH索引带来的巨大性能提升
有这样一个业务场景,需要在2个表里比较存在于A表,不存在于B表的数据.表结构如下: T_SETTINGS_BACKUP | CREATE TABLE `T_SETTINGS_BACKUP` ( `FI ...
C语言实现常用排序算法——基数排序
#include<stdio.h> #include<math.h> #define SIZE 10 #define C_SIZE 20 /*行数稳定=10,切记!列数务必搞的 ...
Laravel ---【转】PhpStorm下Laravel代码智能提示
[转]http://blog.csdn.net/pangchengyong0724/article/details/54706775 第一步:在项目的composer.json中添加如下一行 &quo ...
Hive 学习之路（六）—— Hive 视图和索引
一.视图 1.1 简介 Hive 中的视图和RDBMS中视图的概念一致,都是一组数据的逻辑表示,本质上就是一条SELECT语句的结果集.视图是纯粹的逻辑对象,没有关联的存储(Hive 3.0.0引入的 ...
教妹子用IDEA创建web应用，部署到Tomcat服务器
自从上一篇原创发表之后,粉丝反应热烈.主要分两派,一派关注技术的,觉得看了那么多的公众号文章,终于找到一篇能看懂的了,于是沾沾自喜.另一派是关注妹子的,感叹自己空有一身绝技,公司里却无妹子可教,大喊可 ...

CNN神经网络之卷积操作

一维卷积：tf.layers.conv1d()

例子

二维卷积：tf.layers.conv2d()

参数：^[4]

返回：

例子：

卷积层中的输出大小计算

有效卷积(valid)、同维卷积(same)、完全卷积(full)

参考文献：

CNN神经网络之卷积操作的更多相关文章

随机推荐

热门专题

CNN神经网络之卷积操作

一维卷积：tf.layers.conv1d()

例子

二维卷积：tf.layers.conv2d()

参数：[4]

返回：

例子：

卷积层中的输出大小计算

有效卷积(valid)、同维卷积(same)、完全卷积(full)

参考文献：

CNN神经网络之卷积操作的更多相关文章

随机推荐

热门专题

参数：^[4]