作者：szx_spark

1. Padding

在卷积操作中，过滤器（又称核）的大小通常为奇数，如3x3，5x5。这样的好处有两点：

在特征图（二维卷积）中就会存在一个中心像素点。有一个中心像素点会十分方便，便于指出过滤器的位置。
在没有padding的情况下，经过卷积操作，输出的数据维度会减少。以二维卷积为例，输入大小 \(n\times n\)，过滤器大小\(f\times f\)，卷积后输出的大小为\((n-f+1)\times(n-f+1)\)。
为了避免这种情况发生，可以采取padding操作，padding的长度为\(p\)，由于在二维情况下，上下左右都“添加”长度为\(p\)的数据。构造新的输入大小为\((n+2p)\times(n+2p)\) , 卷积后的输出变为\((n+2p-f+1)\times(n+2p-f+1)\)。
如果想使卷积操作不缩减数据的维度，那么\(p\)的大小应为\((f-1)/2\)，其中\(f\)是过滤器的大小，该值如果为奇数，会在原始数据上对称padding，否则，就会出现向上padding 1个，向下padding 2个，向左padding 1个，向右padding 2个的情况，破坏原始数据结构。

2. Stride

卷积中的步长大小为\(s\)，指过滤器在输入数据上，水平/竖直方向上每次移动的步长，在Padding 公式的基础上，最终卷积输出的维度大小为：

\[\left \lfloor \frac{n+2p-f}{s}+1 \right \rfloor \times \left \lfloor \frac{n+2p-f}{s}+1 \right \rfloor\]

\(\left \lfloor \right\rfloor\)符号指向下取整，在python 中为floor地板除操作。

3. Channel

通道，通常指数据的最后一个维度（三维），在计算机视觉中，RGB代表着3个通道(channel)。

举例说明：现在有一张图片的大小为\(6\times 6\times 3\)，过滤器的大小为\(3\times 3\times n_c\), 这里\(n_c\)指过滤器的channel大小，该数值必须与输入的channel大小相同，即\(n_c=3\)。
如果有\(k\)个\(3\times 3\times n_c\)的过滤器，那么卷积后的输出维度为\(4\times 4\times k\)。注意此时\(p=0, s=1\)，\(k\)表示输出数据的channel大小。一般情况下，\(k\)代表\(k\)个过滤器提取的k个特征，如\(k=128\)，代表128个\(3\times 3\)大小的过滤器，提取了128个特征，且卷积后的输出维度为\(4\times 4\times 128\)。

在多层卷积网络中，以计算机视觉为例，通常情况下，图像的长和宽会逐渐缩小，channel数量会逐渐增加。

4. Pooling

除了卷积层，卷积网络使用池化层来缩减数据的大小，提高计算的速度，同时提高所提取特征的鲁棒性。池化操作不需要对参数进行学习，只是神经网络中的静态属性。
池化层中，数据的维度变化与卷积操作类似。池化后的channel数量与输入的channel数量相同，因为在每个channel上单独执行最大池化操作。
f=2, s=2，相当于对数据维度的减半操作，f指池化层过滤器大小，s指池化步长。

5. 卷积神经网络（CNN）示例

课堂笔记中关于简单卷积神经网络的介绍：

一个用于手写数字识别的CNN结构如下图所示：

该网络应用了两层卷积，并且在第二个池化层之后又接了几个全连接层，这样做的目的是避免某一层的激活值数量减少的太快，具体原因后文解释。

与卷积神经网络的参数数量计算相关的问题：

该手写数字识别的CNN具体参数数量可视化如下所示：

从图中可以发现，卷积层的参数数量较小，大部分参数集中在全连接层。而且随着网络层的加深，激活值数量逐渐减少，如果激活值数量下降太快，会影响网络的性能。
因此需要构建多个全连接层，而不是一个全连接层一步到位。

6. 卷积层的好处

与只用全连接层相比，卷积层的主要优点是参数共享和稀疏连接，这使得卷积操作所需要学习的参数数量大大减少。

吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上）的更多相关文章

【Deeplearning.ai 】吴恩达深度学习笔记及课后作业目录
吴恩达深度学习课程的课堂笔记以及课后作业代码下载:https://github.com/douzujun/Deep-Learning-Coursera 吴恩达推荐笔记:https://mp.weix ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（一）
Padding 在卷积操作中,过滤器(又称核)的大小通常为奇数,如3x3,5x5.这样的好处有两点: 在特征图(二维卷积)中就会存在一个中心像素点.有一个中心像素点会十分方便,便于指出过滤器的位置. ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（二）
经典网络 LeNet-5 AlexNet VGG Ng介绍了上述三个在计算机视觉中的经典网络.网络深度逐渐增加,训练的参数数量也骤增.AlexNet大约6000万参数,VGG大约上亿参数. 从中我们可 ...
吴恩达深度学习笔记（deeplearning.ai）之循环神经网络（RNN）（三）
1. 导读本节内容介绍普通RNN的弊端,从而引入各种变体RNN,主要讲述GRU与LSTM的工作原理. 事先声明,本人采用ng在课堂上所使用的符号系统,与某些学术文献上的命名有所不同,不过核心思想都是 ...
吴恩达深度学习笔记（八） —— ResNets残差网络
(很好的博客:残差网络ResNet笔记) 主要内容: 一.深层神经网络的优点和缺陷二.残差网络的引入三.残差网络的可行性四.identity block 和 convolutional bloc ...
吴恩达深度学习笔记（十二）—— Batch Normalization
主要内容: 一.Normalizing activations in a network 二.Fitting Batch Norm in a neural network 三.Why does ...
吴恩达深度学习笔记（七） —— Batch Normalization
主要内容: 一.Batch Norm简介二.归一化网络的激活函数三.Batch Norm拟合进神经网络四.测试时的Batch Norm 一.Batch Norm简介 1.在机器学习中,我们一般会 ...
吴恩达深度学习笔记1-神经网络的编程基础(Basics of Neural Network programming)
一:二分类(Binary Classification) 逻辑回归是一个用于二分类(binary classification)的算法.在二分类问题中,我们的目标就是习得一个分类器,它以对象的特征向量 ...
吴恩达深度学习笔记（十一）—— dropout正则化
主要内容: 一.dropout正则化的思想二.dropout算法流程三.dropout的优缺点一.dropout正则化的思想在神经网络中,dropout是一种“玄学”的正则化方法,以减少过拟合 ...

随机推荐

python pip install 报错TypeError: unsupported operand type(s) for -=: 'Retry' and 'int' Command "python setup.py egg_info" failed with error code 1 in
pip install http://download.pytorch.org/whl/cu80/torch-0.2.0.post3-cp27-cp27mu-manylinux1_x86_64.whl ...
10.2-uC/OS-III内部任务管理（任务状态）
1.任务状态从用户的观点来看,任务可以是有 5种状态,见图 5-6.展示了任务状态间的转换关系. {休眠状态,就绪状态,运行状态,挂起状态,中断状态} (1).处于休眠状态的任务驻留于内存但未被uC ...
vivado SDK之找不到"platform.h"
解决方法:建工程的时候不要选择empty application,而是选择hello world,里面会自动包含platform.c,platform.h等. 另外,常用的xgpio.h头文件有时候 ...
vue-router重新定向、redirect与alias区别
redirect app.vue <router-link to="/goParams/918/i like vue">goParams</router-link ...
001-js-时间格式化
方法一. // 对Date的扩展,将 Date 转化为指定格式的String // 月(M).日(d).小时(h).分(m).秒(s).季度(q) 可以用 1-2 个占位符, // 年(y)可以用 1 ...
python的map函数
map:对指定序列做映射 python3中的: map(function, iterable, ...) map(lambda x, y: x + y, [1, 3, 5, 7, 9], [2, 4, ...
one order 理解
1: one order core
MySql语句常用命令整理---多表查询
首先第一张表还是我们单表查询之前用到t_employee,我们在另外新建一个表t_dept(部门表)建表命令如下: drop table if exists t_dept; CREATE TABLE ...
phpstudy安装redis
php安装扩展,首先要在php官网下载相应的库文件, http://pecl.php.net/package/redis 下载相应版本的文件,首先phpinfo()看看当前的php环境版本等等我 ...
myloader原理介绍
myloader恢复主要流程 1.首先由myloader主线程完成建库建表,依次将备份目录下建库和建表文件执行应用到目标数据库实例中: 2.接着myloader主线程会生成多个工作线程,由这些 ...

吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上）