4.2深度卷积网络

觉得有用的话,欢迎一起讨论相互学习~Follow Me

参考文献
[LeNet]--Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
[AlexNet]--Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]// International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012:1097-1105.
[VGG-16]--Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Computer Science, 2014.

2.2经典网络

LeNet-5

LeNet针对的是单通道的灰度图像
原始图像为\(32*32*1\)的单通道灰度图像
第一层使用的是\(6个5*5\)的卷积核，步长为1，Padding 为0，图像尺寸缩小到\(28*28\)
接着使用池化窗口为\(2*2\)的平均池化窗口，其中步长为2。当时更趋向于使用平均池化方法，现在更倾向于使用最大池化方法。--输出的结果是一个\(14*14*6\)的图像。
第二层使用的是\(16个5*5\)的卷积核，步长为1，Padding 为0，图像尺寸缩小到\(10*10\)。当时几乎不使用Padding填充的方法，所以每次池化后特征图大小都会变小。
接着使用池化窗口为\(2*2\)的平均池化窗口，其中步长为2。则输出的结果是一个\(5*5*16\)的图像。
紧接着是一个具有120个节点的全连接层FC1，其和上一层的高级特征图中的400个节点进行全连接，而后是全连接层FC2，有84个神经元，最后与输出神经元相连接得到模型最终的输出。

讨论
其对现在的启发是：随着网络层数的递增，使用的卷积核的个数增加，特征图的高度和宽度逐渐减小，而深度逐渐增加。
过去人们使用Sigmoid函数和Tanh函数，现在主要使用ReLU函数。
各网络层之间存在连接，每个卷积核的信道数和其输入的信道数相同。

AlexNet

AlexNet首先用一张\(227*227*3\)的图片作为输入，实际上原文使用的图像是\(224*224*3\)作为输入，但是如果你尝试输入会发现\(227*227\)这个尺寸更好一些。
第一层使用96个\(11*11\)的卷积核，步幅为4，因此图像尺寸缩小到\(55*55\),然后使用一个\(3*3\)的池化窗口构建最大池化层，步幅为2，则此时特征图尺寸缩小为\(27*27*96\)。
第二层使用256个\(5*5\)的卷积核，使用“SAME”模式进行填充，则得到\(27*27*256\)的特征图。接着使用\(3*3\)的池化窗口构建最大池化层，步长为2，则此时特征图尺寸缩小为\(13*13*256\)
第二层使用256个\(5*5\)的卷积核，使用“SAME”模式进行填充，则得到\(27*27*256\)的特征图。接着使用\(3*3\)的池化窗口构建最大池化层，步长为2，则此时特征图尺寸缩小为\(13*13*256\)
第三层使用384个\(3*3\)的卷积核，使用“SAME”模式进行填充，则得到\(13*13*384\)的特征图。连续对特征图进行三次卷积操作，均使用“SAME”模式，卷积核个数分别为“384”，“384”，“256”之后使用\(3*3\)池化窗口的池化层对其进行池化操作，且池化步长为2.最终得到\(6*6*256\)大小的特征图。
将其展开为9216个单元，然后接上两个具有4096个神经元节点的全连接层，最后连接上一个单独的Softmax函数用以输出识别的结果。

讨论

AlexNet网络比LeNet-5网络要大的多，LeNet-5网络大约有6万个参数，AlexNet网络包含约6000万个参数。这使得其能识别更多的特征。
AlexNet网络比LeNet-5网络表现更为出色的另一个原因是因为它使用了ReLU激活函数
对于AlexNet，其使用了LRN的结构(局部响应归一化)，简单而言是在中间特征图中每一个点上所有信道的值进行归一化操作。由于有研究证明其效果并不明显，所以我们并没有在此进行详细介绍。

[lrn局部响应归一化示意图]

VGG-16

VGG-16并没有太多的超参数，其只专注于构建卷积层的简单网络
首先用\(3*3\)的卷积核，步幅为1，构建卷积层，Padding="SAME",然后使用\(2*2\)的卷积核，步幅为2，构建最大池化层。
对于一个\(224*224*3\)的图片，使用64个上述卷积核进行两次卷积操作，得到\(224*224*64\)的特征图，再使用上述池化方式对其进行池化操作，得到\(112*112*64\)的特征图。再对其使用128个上述卷积核进行两次卷积操作后得到\(112*112*128\)的特征图。接着使用上述池化方式对其进行池化操作，得到\(56*56*128\)的特征图。再使用256个上述卷积核对特征图进行三次卷积操作得到\(56*56*256\)的特征图。再池化，512个卷积核卷积三次，池化，512个卷积核卷积三次，池化。最终得到\(7*7*512\)结构的特征图，然后进行全连接操作.后接两个具有4096个节点的全连接层，最后接上Softmax节点。具体网络结构如下图所示:

讨论

VGG-16指的是这个网络包含16个卷积层和全连接层，总共包含1.38亿个参数。虽然网络较大，参数量多，但是结构并不复杂。网络结构十分规整。
每一层的卷积核个数都进行翻倍，所以特征图中的信道数量也增加一倍，很有规律性，从这一点来说，这篇文章十分吸引人。

[DeeplearningAI笔记]卷积神经网络2.2经典网络的更多相关文章

[DeeplearningAI笔记]卷积神经网络4.1-4.5 人脸识别/one-shot learning/Siamase网络/Triplet损失/将面部识别转化为二分类问题
4.4特殊应用:人脸识别和神经网络风格转换觉得有用的话,欢迎一起讨论相互学习~Follow Me 4.1什么是人脸识别 Face verification人脸验证 VS face recogniti ...
[DeeplearningAI笔记]卷积神经网络2.5-2.7 Network in Network/1*1卷积/Inception网络/GoogleNet
4.2深度卷积网络觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Inception网络 --Szegedy C, Liu W, Jia Y, et al. Going deepe ...
卷积神经网络的一些经典网络2（Inception）
在架构内容设计方面,其中一个比较有帮助的想法是使用1x1卷积.1x1卷积能做什么? 对于6x6x1的通道的图片来说,1x1卷积效果不佳,如果是一张6x6x32的图片,那么使用1x1卷积核进行卷积效果更 ...
卷积神经网络的一些经典网络（Lenet，AlexNet，VGG16，ResNet）
LeNet – 5网络网络结构为: 输入图像是:32x32x1的灰度图像卷积核:5x5,stride=1 得到Conv1:28x28x6 池化层:2x2,stride=2 (池化之后再经过激活函数 ...
[DeeplearningAI笔记]卷积神经网络4.6-4.10神经网络风格迁移
4.4特殊应用:人脸识别和神经网络风格转换觉得有用的话,欢迎一起讨论相互学习~Follow Me 4.6什么是神经网络风格转换neural style transfer 将原图片作为内容图片Cont ...
[DeeplearningAI笔记]卷积神经网络3.10候选区域region proposals与R-CNN
4.3目标检测觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.10 region proposals候选区域与R-CNN 基于滑动窗口的目标检测算法将原始图片分割成小的样本图片,并传入分 ...
[DeeplearningAI笔记]卷积神经网络3.1-3.5目标定位/特征点检测/目标检测/滑动窗口的卷积神经网络实现/YOLO算法
4.3目标检测觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.1目标定位对象定位localization和目标检测detection 判断图像中的对象是不是汽车--Image clas ...
[DeeplearningAI笔记]卷积神经网络1.9-1.11池化层/卷积神经网络示例/优点
4.1卷积神经网络觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.9池化层优点池化层可以缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性. 池化层操作池化操作与卷积操作类似 ...
[DeeplearningAI笔记]卷积神经网络1.6-1.7构造多通道卷积神经网络
4.1卷积神经网络觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.6多通道卷积原理对于一个多通道的卷积操作,可以将卷积核设置为一个立方体,则其从左上角开始向右移动然后向下移动,这里设 ...

随机推荐

遗传算法框架GAFT优化小记
前言前段时间一直在用自己写的遗传算法框架测试算法在优化力场参数的效果,但是跑起来效率很慢,因为适应度函数需要调用多次力场程序计算能量,但是还是比我预想中的慢我也没有及时对程序进行profiling和 ...
ES6的新特性（5）——数值的扩展
数值的扩展二进制和八进制表示法 ES6 提供了二进制和八进制数值的新的写法,分别用前缀0b(或0B)和0o(或0O)表示. 0b111110111 === 503 // true 0o767 === ...
冲刺ing-5
第五次Scrum冲刺队员完成的任务队员完成任务吴伟华 Leangoo的看板截图,燃尽图蔺皓雯编写博客蔡晨旸测试曾茜测试鲁婧楠测试杨池宇测试成员遇到的问题队员问题吴伟 ...
Linux 下web开发环境搭建-jdk环境搭建
Centos 7 附:windows 下jdk环境变量 CLASSPATH .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools ...
VUE AXIOS 跨域问题
背景: 后台跨域使用通配符:context.Response.Headers.Add("Access-Control-Allow-Origin", "*"); ...
Ubuntu命令行安装显卡驱动
1. sudo apt-et purge nvidia* 卸载原有驱动 2. sudo add-apt-repository ppa:graphics-drivers sudo apt-get upd ...
0302思考&回答
看完这两个网页,我们可以看出it行业始终是一门热门行业,在现在这个人潮汹涌的人才市场,面对严峻的就业形势,我们应该拿什么去参见招聘?人多而工作职位有限,这警醒我们必须拥有一技之长,否则则会被淘汰.如果 ...
Qt动态连接库/静态连接库创建与使用，QLibrary动态加载库
版权声明:若无来源注明,Techie亮博客文章均为原创. 转载请以链接形式标明本文标题和地址: 本文标题:Qt动态连接库/静态连接库创建与使用,QLibrary动态加载库本文地址:https ...
【转】MySQL数据类型
1.整型 MySQL数据类型含义(有符号) tinyint(m) 1个字节范围(-128~127) smallint(m) 2个字节范围(-32768~32767) mediumint(m) ...
bzoj4815[CQOI2017]小Q的格子
题意不简述题意了,简述题意之后这道题就做出来了.放个原题面. 小Q是个程序员. 作为一个年轻的程序员,小Q总是被老C欺负,老C经常把一些麻烦的任务交给小Q来处理. 每当小Q不知道如何解决时,就只好向 ...

[DeeplearningAI笔记]卷积神经网络2.2经典网络

4.2深度卷积网络

觉得有用的话,欢迎一起讨论相互学习~Follow Me

2.2经典网络

LeNet-5

讨论

AlexNet

讨论

VGG-16

讨论

[DeeplearningAI笔记]卷积神经网络2.2经典网络的更多相关文章

随机推荐

热门专题