『TensorFlow』读书笔记_Inception_V3

1.网络背景

自2012年Alexnet提出以来，图像分类、目标检测等一系列领域都被卷积神经网络CNN统治着。接下来的时间里，人们不断设计新的深度学习网络模型来获得更好的训练效果。一般而言，许多网络结构的改进（例如从VGG到RESNET可以给很多不同的计算机视觉领域带来进一步性能的提高。
这些CNN模型都有一个通病：计算量大。最早的AlexNet含有60M个参数，之后的VGGNet参数大致是AlexNet的3倍之多，而14年GoogLe提出的GoogleNet仅有5M个参数，效果和AlexNet不相上下。虽然有一些计算技巧可以减少计算量，但是在无形中会增加模型的复杂度。参数少的模型在一些超大数据量或内存受限的场景下具有很大优势。

2.卷积的因式分解

GoogleNet带来的性能提升很大程度上要归功于“降维”，也就是卷积分解的一种。考虑到网络邻近的激活单元高度相关，因此聚合之前进行降维可以得到类似于局部特征的东西。接下来主要讨论其他的卷积分解方法。既然Inception网络是全卷积，卷积计算变少也就意味着计算量变小，这些多出来的计算资源可以来增加filter-bank的尺寸大小。

卷积因式分解成小的卷积

卷积核大，计算量也是成平方地增大。假设有一个5*5的卷积核，我们可以Figure1将其分成两次3*3卷积，这样输出的尺寸就一样了。虽然5*5的卷积可以捕捉到更多的邻近关联信息，但两个3*3组合起来，能观察到的“视野”就和5*5的一样了。
进行分解后，原来的Inception结构也相应发生改变（从Figure4变到Figure5）。
还有两个问题，一个是就是这样分解是否会导致表达损失，还有一个是是否要在两个卷积之间添加非线性计算。通过实验表明，因式分解没有带来太大问题，而在卷积之间添加非线性效果也更好。

卷积因式分解为空间不对称卷积

其实，以上的卷积分解还不是最优策略，3*3卷积还可以进一步分解为1*3和3*1，两个卷积分别捕捉不同方向的信息，参数只有之前的6/9。其实，这个可以推广到n*n卷积的情况，n*n卷积因式分解为1*n和n*1。这个方法在网络前面部分似乎表现欠佳，但在中间层起到很好的效果。

3.辅助分类器

辅助分类器这个概念在GoogleNet中已经用到了，就是把一些网络中间层提前拿出类进行回归分类，主要目的是为了更有效地回传梯度。作者发现，辅助分类器在其中扮演者regularizer的角色，因为辅助分类器使用了batch normalization后，效果会更好。

4.降低特征图尺寸

为了减少计算量且保留特征表达，作者提出一种双线结构，将分别进行池化和步长为2的卷积操作，最后在合并起来（如下图）。

『TensorFlow』读书笔记_Inception_V3_上的更多相关文章

『TensorFlow』读书笔记_Inception_V3_下
极为庞大的网络结构,不过下一节的ResNet也不小线性的组成,结构大体如下: 常规卷积部分->Inception模块组1->Inception模块组2->Inception模块组3 ...
『TensorFlow』读书笔记_降噪自编码器
『TensorFlow』降噪自编码器设计之前学习过的代码,又敲了一遍,新的收获也还是有的,因为这次注释写的比较详尽,所以再次记录一下,具体的相关知识查阅之前写的文章即可(见上面链接). # Aut ...
『TensorFlow』读书笔记_VGGNet
VGGNet网络介绍 VGG系列结构图, 『cs231n』卷积神经网络工程实践技巧_下 1,全部使用3*3的卷积核和2*2的池化核,通过不断加深网络结构来提升性能. 所有卷积层都是同样大小的filte ...
『TensorFlow』读书笔记_ResNet_V2
『PyTorch × TensorFlow』第十七弹_ResNet快速实现要点神经网络逐层加深有Degradiation问题,准确率先上升到饱和,再加深会下降,这不是过拟合,是测试集和训练集同时下 ...
『TensorFlow』读书笔记_进阶卷积神经网络_分类cifar10_上
完整项目见:Github 完整项目中最终使用了ResNet进行分类,而卷积版本较本篇中结构为了提升训练效果也略有改动本节主要介绍进阶的卷积神经网络设计相关,数据读入以及增强在下一节再与介绍网络相关 ...
『TensorFlow』读书笔记_简单卷积神经网络
如果你可视化CNN的各层级结构,你会发现里面的每一层神经元的激活态都对应了一种特定的信息,越是底层的,就越接近画面的纹理信息,如同物品的材质. 越是上层的,就越接近实际内容(能说出来是个什么东西的那些 ...
『TensorFlow』读书笔记_SoftMax分类器
开坑之前今年3.4月份的时候就买了这本书,同时还买了另外一本更为浅显的书,当时读不懂这本,所以一度以为这本书很一般,前些日子看见知乎有人推荐它,也就拿出来翻翻看,发现写的的确蛮好,只是稍微深一点,当 ...
『TensorFlow』读书笔记_多层感知机
多层感知机输入->线性变换->Relu激活->线性变换->Softmax分类多层感知机将mnist的结果提升到了98%左右的水平知识点过拟合:采用dropout解决,本 ...
『TensorFlow』读书笔记_进阶卷积神经网络_分类cifar10_下
数据读取部分实现文中采用了tensorflow的从文件直接读取数据的方式,逻辑流程如下, 实现如下, # Author : Hellcat # Time : 2017/12/9 import os ...

随机推荐

Ｃ++11 vector使用emplace_back代替push_back
C++11中,针对顺序容器(如vector.deque.list),新标准引入了三个新成员:emplace_front.emplace和emplace_back,这些操作构造而不是拷贝元素.这些操作分 ...
pycharm import pygame 出现报错：No module named 'pygame'
首先发现装的Python 有问题原来的Python3.6.4版本安装完成后Scripts文件夹里空白的,什么也没有,从https://www.python.org/downloads/windows/ ...
element-ui table表格展开行每次只能展开一行
https://www.jianshu.com/p/a59c22202f2c <template> <el-table @expand-change="expandSele ...
[js]变量提升-关于条件
条件函数变量提示于全局中函数变量提升不一样. 条件中: 函数变量提升, 只是声明(现新版本浏览器中) if(g()){ function g() { return true } console.log ...
安装WIN7/WIN10上的 CPU版本的TensorFlow
随手记 ancaconda Anaconda2-5.0.1-Windows-x86_64(python3.5 ancaconda python-3.5.2-amd64 安装TensorFlow的时候自 ...
Linux平台 Oracle 18c RAC安装Part1：准备工作
一.实施前期准备工作 1.1 服务器安装操作系统 1.2 Oracle安装介质 1.3 共享存储规划 1.4 网络规范分配二.安装前期准备工作 2.1 各节点系统时间校对 2.2 各节点关闭防火墙和 ...
haier周的计算原则
现使用oracle的sql表示出haier周, 经过对其生成结果的分析,发现海尔周是以周日到周六分别作为一周的始末, 用到的oracle sql中会涉及到calendar week的定义,还涉及到了I ...
[macOS] keychain的跳坑之旅！git拉取的权限问题
故事背景,svn与git各有长处,不过git大势所趋吧,那就搞搞.git的服务端,是基于phabricator搭建的,关于它的资料自行google就好了.其实之前运维已经搭好了phabricator了 ...
html5+PHP,websocket无法连接的问题（Call to undefined function socket_create()）
首先是配置文件的问题,打开extension=php_gd2.dll和extension=php_sockets.dll 扩展. 主要注意的是你当前系统使用的php版本和环境变量里面的php版本是否一 ...
爬虫----requests模块
一.介绍 #介绍:使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) #注意:requests库发送请求将网页内 ...

『TensorFlow』读书笔记_Inception_V3_上

1.网络背景

2.卷积的因式分解

卷积因式分解成小的卷积

卷积因式分解为空间不对称卷积

3.辅助分类器

4.降低特征图尺寸

『TensorFlow』读书笔记_Inception_V3_上的更多相关文章

随机推荐

热门专题