4.2深度卷积网络

觉得有用的话,欢迎一起讨论相互学习~Follow Me

参考文献
[LeNet]--Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
[AlexNet]--Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012:1097-1105.
[VGG-16]--Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Computer Science, 2014.

2.2经典网络

LeNet-5

  • LeNet针对的是单通道的灰度图像
  • 原始图像为\(32*32*1\)的单通道灰度图像
  • 第一层使用的是\(6个5*5\)的卷积核,步长为1,Padding 为0,图像尺寸缩小到\(28*28\)
  • 接着使用池化窗口为\(2*2\)的平均池化窗口,其中步长为2。当时更趋向于使用平均池化方法,现在更倾向于使用最大池化方法。--输出的结果是一个\(14*14*6\)的图像。
  • 第二层使用的是\(16个5*5\)的卷积核,步长为1,Padding 为0,图像尺寸缩小到\(10*10\)。当时几乎不使用Padding填充的方法,所以每次池化后特征图大小都会变小。
  • 接着使用池化窗口为\(2*2\)的平均池化窗口,其中步长为2。则输出的结果是一个\(5*5*16\)的图像。
  • 紧接着是一个具有120个节点的全连接层FC1,其和上一层的高级特征图中的400个节点进行全连接,而后是全连接层FC2,有84个神经元,最后与输出神经元相连接得到模型最终的输出。

    讨论

  • 其对现在的启发是:随着网络层数的递增,使用的卷积核的个数增加,特征图的高度和宽度逐渐减小,而深度逐渐增加。
  • 过去人们使用Sigmoid函数和Tanh函数,现在主要使用ReLU函数。
  • 各网络层之间存在连接,每个卷积核的信道数和其输入的信道数相同。


AlexNet

  • AlexNet首先用一张\(227*227*3\)的图片作为输入,实际上原文使用的图像是\(224*224*3\)作为输入,但是如果你尝试输入会发现\(227*227\)这个尺寸更好一些。
  • 第一层使用96个\(11*11\)的卷积核,步幅为4,因此图像尺寸缩小到\(55*55\),然后使用一个\(3*3\)的池化窗口构建最大池化层,步幅为2,则此时特征图尺寸缩小为\(27*27*96\)。
  • 第二层使用256个\(5*5\)的卷积核,使用“SAME”模式进行填充,则得到\(27*27*256\)的特征图。接着使用\(3*3\)的池化窗口构建最大池化层,步长为2,则此时特征图尺寸缩小为\(13*13*256\)
  • 第二层使用256个\(5*5\)的卷积核,使用“SAME”模式进行填充,则得到\(27*27*256\)的特征图。接着使用\(3*3\)的池化窗口构建最大池化层,步长为2,则此时特征图尺寸缩小为\(13*13*256\)
  • 第三层使用384个\(3*3\)的卷积核,使用“SAME”模式进行填充,则得到\(13*13*384\)的特征图。连续对特征图进行三次卷积操作,均使用“SAME”模式,卷积核个数分别为“384”,“384”,“256”之后使用\(3*3\)池化窗口的池化层对其进行池化操作,且池化步长为2.最终得到\(6*6*256\)大小的特征图。
  • 将其展开为9216个单元,然后接上两个具有4096个神经元节点的全连接层,最后连接上一个单独的Softmax函数用以输出识别的结果。

讨论

  • AlexNet网络比LeNet-5网络要大的多,LeNet-5网络大约有6万个参数,AlexNet网络包含约6000万个参数。这使得其能识别更多的特征。
  • AlexNet网络比LeNet-5网络表现更为出色的另一个原因是因为它使用了ReLU激活函数
  • 对于AlexNet,其使用了LRN的结构(局部响应归一化),简单而言是在中间特征图中每一个点上所有信道的值进行归一化操作。由于有研究证明其效果并不明显,所以我们并没有在此进行详细介绍。

    [lrn局部响应归一化示意图]


VGG-16

  • VGG-16并没有太多的超参数,其只专注于构建卷积层的简单网络
  • 首先用\(3*3\)的卷积核,步幅为1,构建卷积层,Padding="SAME",然后使用\(2*2\)的卷积核,步幅为2,构建最大池化层。
  • 对于一个\(224*224*3\)的图片,使用64个上述卷积核进行两次卷积操作,得到\(224*224*64\)的特征图,再使用上述池化方式对其进行池化操作,得到\(112*112*64\)的特征图。再对其使用128个上述卷积核进行两次卷积操作后得到\(112*112*128\)的特征图。接着使用上述池化方式对其进行池化操作,得到\(56*56*128\)的特征图。再使用256个上述卷积核对特征图进行三次卷积操作得到\(56*56*256\)的特征图。再池化,512个卷积核卷积三次,池化,512个卷积核卷积三次,池化。最终得到\(7*7*512\)结构的特征图,然后进行全连接操作.后接两个具有4096个节点的全连接层,最后接上Softmax节点。具体网络结构如下图所示:

讨论

  • VGG-16指的是这个网络包含16个卷积层和全连接层,总共包含1.38亿个参数。虽然网络较大,参数量多,但是结构并不复杂。网络结构十分规整。
  • 每一层的卷积核个数都进行翻倍,所以特征图中的信道数量也增加一倍,很有规律性,从这一点来说,这篇文章十分吸引人。

[DeeplearningAI笔记]卷积神经网络2.2经典网络的更多相关文章

  1. [DeeplearningAI笔记]卷积神经网络4.1-4.5 人脸识别/one-shot learning/Siamase网络/Triplet损失/将面部识别转化为二分类问题

    4.4特殊应用:人脸识别和神经网络风格转换 觉得有用的话,欢迎一起讨论相互学习~Follow Me 4.1什么是人脸识别 Face verification人脸验证 VS face recogniti ...

  2. [DeeplearningAI笔记]卷积神经网络2.5-2.7 Network in Network/1*1卷积/Inception网络/GoogleNet

    4.2深度卷积网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Inception网络 --Szegedy C, Liu W, Jia Y, et al. Going deepe ...

  3. 卷积神经网络的一些经典网络2(Inception)

    在架构内容设计方面,其中一个比较有帮助的想法是使用1x1卷积.1x1卷积能做什么? 对于6x6x1的通道的图片来说,1x1卷积效果不佳,如果是一张6x6x32的图片,那么使用1x1卷积核进行卷积效果更 ...

  4. 卷积神经网络的一些经典网络(Lenet,AlexNet,VGG16,ResNet)

    LeNet – 5网络 网络结构为: 输入图像是:32x32x1的灰度图像 卷积核:5x5,stride=1 得到Conv1:28x28x6 池化层:2x2,stride=2 (池化之后再经过激活函数 ...

  5. [DeeplearningAI笔记]卷积神经网络4.6-4.10神经网络风格迁移

    4.4特殊应用:人脸识别和神经网络风格转换 觉得有用的话,欢迎一起讨论相互学习~Follow Me 4.6什么是神经网络风格转换neural style transfer 将原图片作为内容图片Cont ...

  6. [DeeplearningAI笔记]卷积神经网络3.10候选区域region proposals与R-CNN

    4.3目标检测 觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.10 region proposals候选区域与R-CNN 基于滑动窗口的目标检测算法将原始图片分割成小的样本图片,并传入分 ...

  7. [DeeplearningAI笔记]卷积神经网络3.1-3.5目标定位/特征点检测/目标检测/滑动窗口的卷积神经网络实现/YOLO算法

    4.3目标检测 觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.1目标定位 对象定位localization和目标检测detection 判断图像中的对象是不是汽车--Image clas ...

  8. [DeeplearningAI笔记]卷积神经网络1.9-1.11池化层/卷积神经网络示例/优点

    4.1卷积神经网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.9池化层 优点 池化层可以缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性. 池化层操作 池化操作与卷积操作类似 ...

  9. [DeeplearningAI笔记]卷积神经网络1.6-1.7构造多通道卷积神经网络

    4.1卷积神经网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.6多通道卷积 原理 对于一个多通道的卷积操作,可以将卷积核设置为一个立方体,则其从左上角开始向右移动然后向下移动,这里设 ...

随机推荐

  1. ERROR [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序

    在用c#生成应用程序的时候,读写dbf时,open方法出错 ERROR [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序 以前这个程序是用着好 ...

  2. PowerShell自定义修改远程桌面RDP端口

    应朋友的要求写了一个通过PowerShell修改远程桌面(Remote Desktop)端口的脚本,不复杂,启动脚本后有两个选项:1.自定义远程桌面:2.回复远程桌面的默认端口3389 发出来给有用的 ...

  3. “取件帮”微信小程序宣传视频链接及内容介绍

    1.视频链接 视频上传至优酷自频道,地址链接:http://v.youku.com/v_show/id_XMzg2NTM3OTc5Ng==.html?spm=a2hzp.8253869.0.0 2.视 ...

  4. CS小分队第一阶段冲刺站立会议(5月14日)

    昨日成果:为抽号计时器添加了第一类抽号,基本实现界面,功能出现了一些错误 遇到问题:我预想通过timer控件来实现随机抽号而拜托随机生成数,但是出现了只有个位随机滚动,其他位数不动的现象,我预计是数值 ...

  5. a7

    组员:陈锦谋 今日内容: PS学习.抠图.图标像素调整 明日计划: PS学习 困难: 不够细心.耐心

  6. lintcode-401-排序矩阵中的从小到大第k个数

    401-排序矩阵中的从小到大第k个数 在一个排序矩阵中找从小到大的第 k 个整数. 排序矩阵的定义为:每一行递增,每一列也递增. 样例 给出 k = 4 和一个排序矩阵: [ [1 ,5 ,7], [ ...

  7. 整理sql server数据类型

    我们在平常开发过程中,在设计数据的时候,经常碰到数据类型选择的问题,为了更快,更合适地选择正确的数据类型,所以在这里做个总结. 分类 sql server 数据类型 c# 数据类型 描述 应用场景 字 ...

  8. 6/2 sprint2 看板和燃尽图的更新

  9. selenium webdriver 表格的定位方法练习

    selenium webdriver 表格的定位方法 html 数据准备 <html> <body> <div id="div1"> <i ...

  10. 第209天:jQuery运动框架封装(二)

    运动框架 一.函数------单物体运动框架封装 1.基于时间的运动原理 动画时间进程 动画距离进程 图解: 物体从0移动到400 当物体移动到200的时候 走了50% 同样的,物体总共运行需要4秒 ...