经典卷积神经网络的学习（三）—

Google Inception Net 首次出现在 ILSVRC 2014 的比赛中（和 VGGNet 同年），就以较大优势拔得头筹。那届比赛中的 Inception Net 一般被称为 Inception V1（version 1），其最大的优势在于控制了参数量（也就控制了计算量）的同时，仍然能够获得非常好的分类性能 —— top-5 错误率 6.67%。

Inception V1 降低餐数量的目的在于以下两点：

参数越多，模型越庞大，需要提供模型学习的数据量也就越大，而当前高质量的数据非常昂贵；
参数越多，相应地耗费的计算资源也会更大；

0. 一些细节问题

Scale images because Inception needs pixels to be between 0 and 255,
- Inception net 要求输入图像的像素值在 0-255 区间内，而不是 0-1，如果原始图像的像素值在 0-1，需要在乘以 255；
The output of the Inception model is a so-called Softmax-function
- Inception net 的输出是 softmax-function，
为什么使用了较多 1×1 的卷积？
- 图片数据天然地邻近区域的数据相关性较高，也即可通过卷积操作使相邻的像素点连接在一起。我们可十分方便构造多个卷积核，在同一空间位置但不同通道的卷积核的输出结果相关性较高。
- 因此一个 1×1 的卷积就可以很自然地将这些相关性很高的、在同一空间位置但不同通道的特征连接在一起，这也正是 1×1 的卷积会频繁地应用到 Inception Net 中的原因。
- 1×1 卷积所连接的节点的相关性是最高的，而稍微大一点尺寸的卷积，3×3、5×5 的卷积所连接的节点相关性也很高，因此可进一步地使用一些稍大尺寸的卷积，增加特征多样性（diversity）；

1. 模型拓扑

Inception V1 有 22 层深，比 AlexNet 的 8 层或者 VGGNet 的 19 层还要更深。
去除了最后的全连接层，而使用全局平均池化层（将图片尺寸变为 1×1）取代全连接层；

如上图所示为 Inception Module 的结构图，可知：

基本结构共有四个分支；Inception Module 的 4 个分支在最后一个聚合操作合并（在输出通道数这个维度上聚合）
Inception Module 中包含了：
- 3 种不同尺寸的卷积：1×1,3×3,5×5
- 1 个最大池化层：3×3

2. Inception Net 家族

2014 年 9 月，Going Deeper with Convolutions ⇒ Inception V1（top-5 错误率 6.67%）
2015 年 2 月，Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate ⇒ Inception V2（top-5 错误率 4.8%）
- 学习了 VGGNet，用两个 3×3 的卷积代替 5×5 的大卷积（以降低参数和减轻过拟合），正如论文标题所言，还提出了有效的 Batch Normalization 方法，可为大型卷积网络的训练加速很多倍；
2015 年 12 月，Rethinking the Inception Architecture for Computer Vision ⇒ Inception V3（top-5错误率 3.5%），主要有下述改进：
- 引入 Factorization into Small convolutions 的思想，讲一个较大的二维卷积拆成两个较小的一维卷积，比如将 7×7 ⇒ 1×7 & 7×1
2016 年 2 月，Inception V4、Inception-ResNet and the Impact of Residual Connections on learning，提出 Inception V4 的概念，（top-5 错误率 3.08%）

经典卷积神经网络的学习（三）—— Inception Net的更多相关文章

经典卷积神经网络的学习（一）—— AlexNet
AlexNet 为卷积神经网络和深度学习正名,以绝对优势拿下 ILSVRC 2012 年冠军,引起了学术界的极大关注,掀起了深度学习研究的热潮. AlexNet 在 ILSVRC 数据集上达到 16. ...
经典卷积神经网络的学习（二）—— VGGNet
1. 简介 VGGNet 是牛津大学计算机视觉组(Visual Geometry Group)和 Google DeepMind 公司的研究员一起研发的深度卷积神经网络,其主要探索了卷积神经网络的深度 ...
经典卷积神经网络（LeNet、AlexNet、VGG、GoogleNet、ResNet）的实现（MXNet版本）
卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现. 其中文章详解卷 ...
TensorFlow实战之实现AlexNet经典卷积神经网络
本文根据最近学习TensorFlow书籍网络文章的情况,特将一些学习心得做了总结,详情如下.如有不当之处,请各位大拿多多指点,在此谢过. 一.AlexNet模型及其基本原理阐述 1.关于AlexNet ...
卷积神经网络(CNN)学习笔记1：基础入门
卷积神经网络(CNN)学习笔记1:基础入门 Posted on 2016-03-01 | In Machine Learning | 9 Comments | 14935 Vie ...
五大经典卷积神经网络介绍：LeNet / AlexNet / GoogLeNet / VGGNet/ ResNet
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! LeNet / AlexNet / GoogLeNet / VGG ...
卷积神经网络CNN学习笔记
CNN的基本结构包括两层: 特征提取层:每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征.一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来: 特征映射层:网络的每个计算层由多 ...
经典卷积神经网络算法(5)：ResNet
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
卷积神经网络 CNN 学习笔记
激活函数Relu 最近几年卷积神经网络中,激活函数往往不选择sigmoid或tanh函数,而是选择relu函数.Relu函数的定义 $$f(x)= max(0,x)$$ Relu函数图像如下图所示: ...

随机推荐

9、str类型和byte类型转换、列表拾遗、元组拾遗、字典拾遗、如何判断对象是否可迭代
str(字节类型,编码) 可用于创建字符串,或者将其他的转换成字符串 a= ‘李露’ #将字符串转换成字节流 b = bytes(a,encoding = 'utf-8') #将字节转换成 ...
Storm新特性之Flux
Storm新特性之Flux Flux是Storm版本号0.10.0中的新组件,主要目的是为了方便拓扑的开发与部署.原先在开发Storm拓扑的时候整个拓扑的结构都是硬编码写在代码中的,当要对其进行改动时 ...
OC的DES加密，使与java的Cipher类用DES/CBC/PKCS5Padding方式的加密结果同样
问题说明: 近期用到DES加密,而且要与java的Cipher类加密的结果保持一致.没研究过java的Cliper,但工作中Cipher依据DES/CBC/PKCS5Padding加密方式生成了一个字 ...
发布一个stl标准库容器类（vector/list）的安全删除方法
话不多说,看代码. #include <functional> #ifndef ASSERT #include <cassert> #define ASSERT assert ...
autohotkey word getfullname (ComObjActive)
直接使用ComObjActive
Geodatabase模型
原文 Geodatabase模型地理数据模型是地理实体及其关系的形式化抽象和数学描述.随着数据库.面向对象等技术的发展,面向对象的地理数据模型成为大型空间数据库的首选方案,它克服了传统地理数据模型的 ...
4、linux下应用创建线程
1.linux创建线程之pthread_create 函数简介 pthread_create是UNIX环境创建线程函数头文件 #include<pthread.h> 函数声明 int p ...
【20.23%】【codeforces 740A】Alyona and copybooks
time limit per test1 second memory limit per test256 megabytes inputstandard input outputstandard ou ...
【LeetCode-面试算法经典-Java实现】【104-Maximum Depth of Binary Tree（二叉树的最大深度）】
[104-Maximum Depth of Binary Tree(二叉树的最大深度)] [LeetCode-面试算法经典-Java实现][全部题目文件夹索引] 原题 Given a binary t ...
HDU 1045 Fire Net(行列匹配变形+缩点建图)
题意:n*n的棋盘上放置房子.同一方同一列不能有两个,除非他们之间被墙隔开,这种话. 把原始图分别按行和列缩点建图:横竖分区.先看每一列.同一列相连的空地同一时候看成一个点,显然这种区域不可以同一时 ...

经典卷积神经网络的学习（三）—— Inception Net

0. 一些细节问题

1. 模型拓扑

2. Inception Net 家族

经典卷积神经网络的学习（三）—— Inception Net的更多相关文章

随机推荐

热门专题