文章《Rethinking the Inception Architecture for Computer Vision》

介绍

VGG与GoogLeNet相比更朴素，但计算量大。GoogLeNet中的Inception结构设计的目的是减少计算量和内存。GoogLeNet中只有5百万参数，是AlexNet的1/12，而VGG的参数是AlexNet的3倍。

如果增大Inception类型模型的容量，如果只是double滤波器组的数量，参数量和计算量将会增大4倍；在许多场景中，不允许这样设计。

下面讲解几个增大卷积网络的原则和优化方法。

通用设计原则

1.避免表示瓶颈，尤其是在网络的前面。前向传播网络可以看作一个有向无环图，从输入到输出。一般来说，representation size从输入到输出特征应该缓慢减小。理论上来说，不能仅仅通过维度得到信息，因为它已经丢弃了许多重要特征例如相关结构，维度只能代表信息的粗略估计。

2.高纬度特征在网络局部处理更加容易。在卷积神经网络中增加非线性可以解耦合特征，训练更快

3.空间聚合可以以低维度嵌入进行，这样不会影响representational power.例如，在进行大尺度卷积（3×3）时，在空间聚合前，先对输入进行降维，这样不会带来严重影响。我们猜测原因为：如果输出是为了空间聚合，那么临近单元的强相关性在降维过程中信息损失会很少。考虑到这些信号容易压缩，降维会加速学习过程

4.平衡宽度和深度。增加宽度或深度都会带来性能上的提升，两者同时增加带了并行提升，但是要考虑计算资源的合理分配。

分解大的卷积核

GoogLeNet性能优异很大程度在于使用了降维。降维可以看做卷积网络的因式分解。例如1×1卷积层后跟着3×3卷积层。在网络角度看，激活层的输出是高相关的；因此在聚合前进行降维，可以得到类似的局部表示性能。

这里考虑计算性能，我们探索其他形式的卷积因式分解。因为Inception结构是全卷积，每一个激活值对应的每一个权重，都对应一个乘法运算。因此减小计算量意味着减少参数。所以通过解耦和参数，可以加快训练。利用节省下来的计算和内存增加filter-bank大小，来提升网络性能。

分解为更小的卷积

大的卷积计算量更大，例如filter相同情况下，5×5卷积核比3×3卷积核计算量大25/9=2.78倍。5×5卷积核相比3×3卷积核有广阔“视野”，可以捕捉更多信息，单纯减小卷积核大小会造成信息损失。是否可以通过多层网络代替5×5卷积。把5×5网络看做全卷积，每个输出是卷积核在输入上滑动；可以通过2层3×3全卷积网络替换。如图所示。

原来的Inception结构：

使用2个3x3替换5x5后的Inception结构：

对于分解的卷积层，使用线性激活还是非线性激活，实验表明，非线性激活性能更好。

空间上分解为非对称卷积核

大于3×3的卷积层，都可以分解为连续的3×3的卷积层，那么是不是可以分解为更小的卷积核呢？实际上分解为非对称的更好，例如一个3×1卷积，后跟一个1×3卷积，相当于3×3卷积。如图：

两层结构计算量减少33%。而2×2卷积替代的话计算量仅仅减少11%

理论上，n×n卷积可以通过1×n->n×1卷积代替，随着n增大，能减少更多计算量。在实践中，前几层这样的分解效果并不好；但是在中等网络中，有着不错的性能（m×m的feature map m介于12到20之间）

使用辅助分类器

GoogLeNet引入了附加分类器，其目的是想把有效梯度传递回去，从而加快训练。我们发现辅助分类器扮演着regularizer的角色；因为当辅助分类器使用了batch-normalized或dropout时，主分类器效果会更好。

降低特征图大小

pooling层用来减小feature map大小，为了避免出现representation bottleneck,在使用pooling前常常增加feature map个数。例如k个d×d的feature map，pooling后为k个d/2×d/2.如果想要得到pooling后有2k个feature map，那么在pooling前面的卷积层卷积核个数应该有2k个。前者卷积计算量为2D^2k^2,而后者为2（d/2）^2k^2，是前者四分之一。这样在representation上会有瓶颈。可以使用另一种方法，降低更多计算量：使用2个模块P和C。P表示pooling，C表示卷积；它们stride都为2.如下图所示：

Inception-V2

我们提出Inception-V2模型。结构图下所示：

把7×7卷积替代为3个3×3卷积。包含3个inception部分。第一部分35×35×288，使用了2个3×3卷积代替传统的5×5；第二部分减小了feature map，增多filters,为17×17×768，使用了n×1->1×n结构；第三部分增多了filter，使用了卷积池化并行结构。网络有42层，但是计算量只有GoogLeNet的2.5倍。

通过平滑标签正则化模型

输入x，模型计算得到类别为k的概率

假设真实分布q(k)，交叉熵损失函数为

最小化交叉熵等价最大化似然函数。交叉熵函数对逻辑输出求导

训练方法

batch-size=32，epoch=100。SGD+momentum，momentum=0.9。使用RMSProp，decay=0.9，ϵ=0.1，效果达到最好。lr=0.045,每2个epoch，衰减0.94。梯度最大阈值=2.0.

低分辨率图像的识别

对于低分辨有图像，使用“高分辨率”receptive field。实践中：1、减小前2个卷积层的stride，2、去掉第一个pooling层。

Inception 2.0的更多相关文章

MySQL SQL审核平台 inception+archer2.0（亲测）
docker run -d --privileged -v `pwd`/archer_data:/data -p 9306:3306 --name archer --hostname archer - ...
【Network Architecture】Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning（转）
文章来源: https://www.cnblogs.com/shouhuxianjian/p/7786760.html Feature Extractor[Inception v4] 0. 背景随着 ...
[C6] Andrew Ng - Convolutional Neural Networks
About this Course This course will teach you how to build convolutional neural networks and apply it ...
ZAM 3D 制作简单的3D字幕流程(二)
原地址:http://www.cnblogs.com/yk250/p/5663907.html 文中表述仅为本人理解,若有偏差和错误请指正! 接着 ZAM 3D 制作简单的3D字幕流程(一) .本篇 ...
ZAM 3D 制作3D动画字幕用于Xaml导出
原地址-> http://www.cnblogs.com/yk250/p/5662788.html 介绍:对经常使用Blend做动画的人来说,ZAM 3D 也很好上手,专业制作3D素材的XAML ...
微信小程序省市区选择器对接数据库
前言,小程序本身是带有地区选着器的(网站:https://mp.weixin.qq.com/debug/wxadoc/dev/component/picker.html),由于自己开发的程序的数据是很 ...
osg编译日志
1>------ 已启动全部重新生成: 项目: ZERO_CHECK, 配置: Debug x64 ------1> Checking Build System1> CMake do ...
学习笔记TF032:实现Google Inception Net
Google Inception Net,ILSVRC 2014比赛第一名.控制计算量.参数量,分类性能非常好.V1,top-5错误率6.67%,22层,15亿次浮点运算,500万参数(AlexNet ...
Inception使用详解
一.Inception简介一款用于MySQL语句的审核的开源工具,不但具备自动化审核功能,同时还具备执行.生成对影响数据的回滚语句功能. 基本架构: 二.Inception安装 1.软件下载下载链接 ...

随机推荐

通过windows自带的系统监视器来查看IIS并发连接数(perfmon.msc)
如果要查看IIS连接数,最简单方便的方法是通过“网站统计”来查看,“网站统计”的当前在线人数可以认为是当前IIS连接数.然而,“网站统计”的当前在线人数统计时间较长,一般为10分钟或15分钟,再加上统 ...
PHP 命名空间namespace 和 use
慕课网教程: http://www.imooc.com/video/7834 PHP 中命名空间的概念和高级语言(如C#.JAVA)有很大的差异,一度让我混淆甚至怀疑它存在的意义和目的. 今天找时间学 ...
Mybatis学习-1（转自 csdn- http://my.csdn.net/hupanfeng 的文章）
简介 MyBatis的前身叫iBatis,本是apache的一个开源项目, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBa ...
svn:database disk image is malformed问题解决方法
今天一客户使用我们软件时突然停电,再次启动软件查询SQLite数据库报 The database disk image is malformed 错误. 百度一下基本上全部是http://www.cn ...
Spring 注解 @Scheduled(cron = "0 0/10 * * * ? ") 任务调度动态改变时间
不需要重启应用就可以动态的改变Cron表达式的值 import java.util.Date; import java.util.concurrent.Executor; import java.ut ...
win10虚拟环境安装scrapy
说明:本人用的是python3.6版本,64位系统. 第一步:创建并激活虚拟环境 virtualenv scrapy scrapy\Scripts\activate 第二步:安装lxml pip in ...
nyoj304 节能
节能时间限制:1000 ms | 内存限制:65535 KB 难度:5 描述 Dr.Kong设计的机器人卡多越来越聪明.最近市政公司交给卡多一项任务,每天早晨5:00开始,它负责关掉ZK大道右侧 ...
iOS swift版本无限滚动轮播图
之前写过oc版本的无限滚动轮播图,现在来一个swift版本全部使用snapKit布局,数字还是pageConrrol样式可选 enum typeStyle: Int { case pageContro ...
个人博客开发之 ueditor 安装
c++标准库之容器
C++最原始的容器之一是数组.数组的特点有: 1.大小固定 2.单独存在的数组建立在栈上,作为对象成员存在的数组建立在堆上还是栈上则要看作为宿主对象是被建立在堆上还是栈上.栈空间是有限的,所以如果数组 ...

Inception 2.0

介绍