TensorFlow系列专题(十三): CNN最全原理剖析（续）

目录：

前言
卷积层（余下部分）

- 卷积的基本结构

卷积层

- 什么是卷积
- 滑动步长和零填充

池化层
卷积神经网络的基本结构
总结
参考文献

一、前言

上一篇我们一直说到了CNN[1]卷积层的特性，今天会继续讲解卷积层的基本结构。

二、卷积层（余下部分）

1. 卷积的基本结构

如图1所示，假设输入到神经网络中的是一张大小为256*256的图像，第一层隐藏层的神经元个数为241*241。在只考虑单通道的情况下，全连接神经网络输入层到第一层隐藏层的连接数为，也就是说输入层到第一层隐藏层有个参数（1为偏置项参数个数）。而在卷积神经网络中，假设我们使用了一个大小为16*16的卷积核，则输入层到第一层隐藏层的连接数为，由于我们的卷积核是共享的，因此参数个数仅为个。有时候为了提取图像中不同的特征，我们可能会使用多个卷积核，假设这里我们使用了100个大小为16*16的卷积核，则输入层到第一层隐藏层的参数个数也仅为，这依然远远少于全连接神经网络的参数个数。

根据图1所示的例子我们可以看到卷积神经网络的两个重要特性：

局部连接：全连接神经网络中，第层的每一个神经元和第层的每一个神经元之间都有连接。而在卷积神经网络中，第层的每一个神经元都只和第层的部分神经元之间有连接，而这个“部分”有多大，则具体取决于卷积核的大小。
权值共享：在卷积神经网络中，同一隐藏层的每一个神经元所使用的卷积核都是相同的，卷积核对同一隐藏层的神经元来说是共享的。

图1 全连接神经网络（左）和卷积神经网络（右）连接数示例

在卷积层中，特征图（feature map，又称为特征映射）是输入层的图像（或其它的特征图）经过卷积之后得到的特征输出。一个卷积核只负责提取某一类特定的特征，为了充分的提取出图像中的信息，我们通常会使用多个卷积核。卷积层的一般性结构可以表示如下：

1）输入特征映射组：输入特征映射组是一个三维的张量（tensor），其中每个切片（slice）矩阵是一个输入特征映射。每个特征映射的大小为M x N，D是输入特征映射的个数。

2）输出特征映射组：输出特征映射组也是一个三维张量，其中每个切片矩阵是一个输出特征映射。每个特征映射的大小为M' x N'，P是输出特征映射的个数。

3）卷积核：卷积核是一个四维张量，其中每个切片矩阵是一个二维的卷积核。

为了更直观的理解，我们看如图2所示的例子。示例中的输入特征映射组有两个特征映射，每个特征映射的大小为5x5，对应有M=5，N=5，D=2。输出特征映射组有三个特征映射，每个特征映射的大小为3x3，对应有M'=3，N'=3，P'=3。卷积核的维度是3x3x2x3，每个二维卷积核的大小为3x3，对应有m=3，n=3，D=2，P=3。

图2一个卷积层的结构示例

图3所示是卷积层中从输入特征映射组x到输出特征映射组的计算过程示例。卷积核分别对输入的特征映射进行卷积，然后将卷积得到的结果相加，再加上一个偏置后得到卷积层的净输入，如式1。最后经过一个非线性激活函数后得到输出特征映射，如式2，其中函数f(·)为非线性激活函数。

式1

式2

在图3所示的例子中，每一个输入特征映射都需要P个卷积核和一个偏置。假设每个二维卷积核的大小为mxn，那么该层卷积层共需要的参数个数为：(mxn)xPxD+P。

图3卷积层中计算过程示例

三、池化层

池化层（pooling layer）也称为子采样层（subsamplinglayer），池化层一般都是紧跟在卷积层之后，它的作用是进行特征选择，减少特征的数量，进而减少网络中参数的数量。

对于一个特征映射，我们可以将其划分为多个区域（这些区域可以有重合部分），池化就是对这些划分后的区域进行下采样（downsampling），然后得到一个值，并将这个值作为该区域的概括。池化层的方式有多种，一般常用的有最大池化（maximumpooling）和平均池化（mean pooling）。

最大池化（maximum pooling）：选取区域内的最大值的神经元作为该区域的概括。
平均池化（mean pooling）：取区域内所有神经元的均值作为该区域的概括。

如图4是一个最大池化和均值池化的示例，这里我们将一个特征映射划分为了4个区域，即池化窗口的大小为2x2，步长为2。

图4 最大池化和平均池化示例

目前大多数卷积神经网络中，池化层仅包含下采样操作，池化层没有需要训练的参数。但在一些早期的卷积网络中，会在池化层中使用一个非线性激活函数，例如我们会面会介绍的LeNet-5。现在，池化层的作用已经越来越小，通过增加卷积的步长也可以达到池化层同样的效果。因此在目前一些比较新的卷积神经网络中，池化层出现的频率已经越来越低。

四、卷积神经网络的基本结构

一个基本的卷积神经网络通常是由卷积层、池化层和全连接层交叉堆叠而成。如图5所示，由连续个卷积层和个池化层构成一个卷积块（M的取值一般为1~5，h的取值一般为0或1），一个卷积神经网络中可以堆叠N个连续的卷积块（N的取值可以很大，较深的网络可以达到100多层）。在N个连续的卷积块之后是K个连续的全连接层（K一般取1~2）。

图5 基本的卷积神经网络结构示意图

五、总结

本节介绍了卷积层的结构及池化层和卷积神经网络的特性，下一章节将结合代码介绍基于CNN的一个实际比赛的冰山雷达波图像识别项目。

六、参考文献

[1]AlexKrizhevsky: ImageNet Classification withDeep Convolutional Neural Networks.NIPS 2012

欢迎关注磐创博客资源汇总站：

http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站：

http://pytorch.panchuang.net/

TensorFlow系列专题(十三): CNN最全原理剖析（续）的更多相关文章

TensorFlow系列专题（五）：BP算法原理
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/ ,学习更多的机器学习.深度学习的知识! 一．反向传播算法简介二．前馈计算的过程第一层隐藏层的计算第 ...
TensorFlow系列专题（九）：常用RNN网络结构及依赖优化问题
欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 目录: 常用的循环神经网络结构多层循环神经网络双向循环神经网络递归神经网络 ...
TensorFlow系列专题（七）：一文综述RNN循环神经网络
欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 目录: 前言 RNN知识结构简单循环神经网络 RNN的基本结构 RNN的运算过程 ...
TensorFlow系列专题(十四): 手把手带你搭建卷积神经网络实现冰山图像分类
目录: 冰山图片识别背景数据介绍数据预处理模型搭建结果分析总结一.冰山图片识别背景这里我们要解决的任务是来自于Kaggle上的一道赛题(https://www.kaggle.com/c/ ...
TensorFlow系列专题（二）：机器学习基础
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/ ,学习更多的机器学习.深度学习的知识! 目录: 数据预处理归一化标准化离散化二值化哑编码特征 ...
TensorFlow系列专题（十一）：RNN的应用及注意力模型
磐创智能-专注机器学习深度学习的教程网站 http://panchuang.net/ 磐创AI-智能客服,聊天机器人,推荐系统 http://panchuangai.com/ 目录: 循环神经网络的应 ...
TensorFlow系列专题（六）：实战项目Mnist手写数据集识别
欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 目录: 导读 MNIST数据集数据处理单层隐藏层神经网络的实现多层隐藏层神经 ...
Tensorflow系列专题（四）：神经网络篇之前馈神经网络综述
目录: 神经网络前言神经网络感知机模型多层神经网络激活函数 Logistic函数 Tanh函数 ReLu函数损失函数和输出单元损失函数的选择均方误差损失函数交叉熵损失函数输出单元的选 ...
TensorFlow系列专题（三）：深度学习简介
一.深度学习的发展历程深度学习的起源阶段深度学习的发展阶段深度学习的爆发阶段二.深度学习的应用自然语言处理语音识别与合成图像领域三．参考文献一.深度学习的发展历程作为机器学习最 ...

随机推荐

java ThreadPoolExecutor初探
导读:线程池是开发中使用频率比较高的组件之一,但是又有多少人真正了解其内部机制呢. 关键词:线程池前言线程池是大家开发过程中使用频率比较高的组件之一,但是其内部原理又有多少人真正清楚呢.最近抽时间 ...
shell编程1：变量的使用与例子
一.Shell脚本的执行通常可以采用以下几种方式: 1):bash script-name或sh script-name(推荐使用) 2):path/script-name 或./script-nam ...
Echarts轻松入门，内附踩坑秘籍
首先介绍一下我们的主角ECharts ECharts,一个纯 Javascript 的图表库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Fir ...
hadoop之完全分布式集群配置（centos7）
一.基础环境现在我们有两台虚拟机了,再克隆两台: 克隆好之后需要做三件事:1.更改主机名称 2.修改ip地址 3.将ip地址和对应的主机号加入到/etc/hosts文件中 1.永久修改主机名 hos ...
LoadRunner 11破解方法：
LoadRunner 11破解方法: 请严格安装顺序操作! a.用LR8.0中的mlr5lprg.dll.lm70.dll覆盖LR11安装目录下“bin”文件夹中的对应文件: b.运行deleteli ...
Matplotlib数据可视化（7）：图片展示与保存
In [1]: import os import matplotlib.image as mpimg from PIL import Image import matplotlib.pyplot as ...
学习RF遇到的问题
1.Windows安装pip命令安装RF报错: File "<stdin>", line 1 pip install robotframework 原因:pip命令不在 ...
MATLAB神经网络（5）基于BP_Adaboost的强分类器设计——公司财务预警建模
5.1 案例背景 5.1.1 BP_Adaboost模型 Adaboost算法的思想是合并多个“弱”分类器的输出以产生有效分类.其主要步骤为:首先给出弱学习算法和样本空间($X$,$Y$),从样本空间 ...
Upload-labs 测试笔记
Upload-labs 测试笔记 By:Mirror王宇阳 2019年11月~ 文件上传解析学习环境要求若要自己亲自搭建环境,请按照以下配置环境,方可正常运行每个Pass. 配置项配置描述 ...
Jmeter——如何使得token在各线程组间引用的游刃有余
在以前的博文中,有介绍过,jmeter基本的关联,关联就是将参数在各接口中动态传参,使得接口脚本变得灵活使用,非一次性脚本.今天再来介绍一种jmeter全局变量的设置与使用,可以让脚本运用更丰富,场景 ...

TensorFlow系列专题(十三): CNN最全原理剖析（续）

TensorFlow系列专题(十三): CNN最全原理剖析（续）的更多相关文章

随机推荐

热门专题