[论文阅读]MobileNetV2: Inverted Residuals and Linear Bottlenecks

0. 本文贡献点

　　本文的主要贡献点是一个构造了一个结构，称为the inverted residual with linear bottleneck。该结构与传统的residual block中维度先缩减后扩增相反，而是先将输入的低维feature map扩增到高维，然后用depthwise convolution方式做卷积运算，然后再使用一个线性的卷积将其映射到低维空间中。

　　Depthwise Separable Convolutions原理可以参考这篇文章。

1. Inverted residual block简单介绍

　　如上图，左边（a）图的传统的residual block，先用1x1卷积将输入的feature map的维度降低，然后进行3x3的卷积操作，最后再用1x1的卷积将维度变大。右边（b）图即为本文提出的结构，先用1x1卷积将输入的feature map维度变大，然后用3x3 depthwise convolution方式做卷积运算，最后使用1x1的卷积运算将其维度缩小。注意，此时的1x1卷积运算后，不再使用ReLU激活函数，而是使用线性激活函数，以保留更多特征信息，保证模型的表达能力。

该block具体结构如下：

　　当stride=1时，block内会有short cut；而当stride=2时，block没有short cut。

2. MobileV2与V1的区别

　　下图是MobileNetV2与MobileNetV1的区别（原图链接）：

主要区别有两点：

（1）Depth-wise convolution之前多了一个1*1的“扩张”层，目的是为了提升通道数，获得更多特征；

（2）最后不采用Relu，而是Linear，目的是防止Relu破坏特征。

MobileNetV2相关资料：

附：

下面段落摘自第二篇文章。

Intuition

　　如上图所示，利用MxN的矩阵B将输入张量（2维，即N=2）变换到M维的空间中，通过ReLU后（y=ReLU(Bx)），再用此矩阵逆恢复原来的张量（即从M维空间变换回2维空间）。可以看到，当M较小时，恢复后的张量坍缩严重，M较大时则恢复较好。

　　这意味着，在较低维度的张量表示上进行ReLU等线性变换会有很大的信息损耗。因而本文提出使用线性变换替代Bottleneck的激活层，而在需要激活的卷积层中，使用较大的M使张量在进行激活前先扩张，整个单元的输入输出是低维张量，而中间的层则用较高维的张量。

2. MobileNetV2网络

　　MobileNetV2网络结构如下：

　　网络的性能如下：

[论文阅读]MobileNetV2: Inverted Residuals and Linear Bottlenecks的更多相关文章

深度学习论文翻译解析（十八）：MobileNetV2: Inverted Residuals and Linear Bottlenecks
论文标题:MobileNetV2: Inverted Residuals and Linear Bottlenecks 论文作者:Mark Sandler Andrew Howard Menglong ...
论文-MobileNetV2: Inverted Residuals and Linear Bottlenecks
1.主要创新 1)提出了一种新的layer module:the inverted residual with linear bottleneck, 2)short connect被置于bottlen ...
MobileNetV2: Inverted Residuals and Linear Bottlenecks
1. 摘要作者提出了一个新的网络架构 MobileNetV2,该架构基于反转残差结构,其中的跳跃连接位于较瘦的瓶颈层之间.中间的扩展层则利用轻量级的深度卷积来提取特征引入非线性,而且,为了维持网络的 ...
YOLO 论文阅读
YOLO(You Only Look Once)是一个流行的目标检测方法,和Faster RCNN等state of the art方法比起来,主打检测速度快.截止到目前为止(2017年2月初),YO ...
[论文阅读] RNN 在阿里DIEN中的应用
[论文阅读] RNN 在阿里DIEN中的应用 0x00 摘要本文基于阿里推荐DIEN代码,梳理了下RNN一些概念,以及TensorFlow中的部分源码.本博客旨在帮助小伙伴们详细了解每一步骤以及为什 ...
分布式多任务学习论文阅读（四）：去偏lasso实现高效通信
1.难点-如何实现高效的通信我们考虑下列的多任务优化问题: \[ \underset{\textbf{W}}{\min} \sum_{t=1}^{T} [\frac{1}{m_t}\sum_{i=1 ...
论文阅读（Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition）
白翔的CRNN论文阅读 1. 论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...
BITED数学建模七日谈之三：怎样进行论文阅读
前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...
论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

随机推荐

javascript最全最好的判断数组的方法
var arr = [1,2,3,1]; var arr2 = [{ abac : 1, abc : 2 }]; function isArrayFn(value){ if (typeof Array ...
informix 随笔
1.新建连接create new database connection 2.database Url: jdbc:informix-sqli://119.84.39.35:29999/gps_pr ...
Python之PIL库的运用、GIF处理h
一.PIL库简介 PIL(Python Image Library)库是Python语言的第三方库,它支持图像存储.显示和处理,它能够处理几乎所有图片格式,可以完成对图像的缩放.剪裁.折叠以及像图片添 ...
Far manager界面混乱问题解决
刚装完,win7和XP上运行,都是界面混乱,看到网上说是属性里改字体,改编码,我试了半天不行: 最后发现,需要far.exe创建快捷方式,在快捷方式的属性里设置字体,编码,窗口大小,废话不多说,上图: ...
H3C_IRF
1.IRF的优点: 跨设备负载均衡规避环路强大的网络扩展能力带宽/可靠性增加 2.IRF域编号存在的意义: 域是一个逻辑概念,一个 IRF 对应一个 IRF 域如果IRF 1 和IRF 2 之 ...
基于Selenium的web自动化框架
转自 : https://www.cnblogs.com/AlwinXu/p/5836709.html 1 什么是selenium Selenium 是一个基于浏览器的自动化工具,它提供了一种跨平台. ...
ios-时间换算
经常会遇到时间转换的,在此收藏一个时间换算的方法〜 #pragma mark 时间换算 + (NSString *)setcreateTime:(NSString *)str { //yyyy-MM- ...
A*搜索详解(2)——再战觐天宝匣
书接上文.在坦克寻径的,tank_way中,A*算法每一步搜索都是选择F值最小的节点,步步为营,使得寻径的结果是最优解.在这个过程中,查找最小F值的算法复杂度是O(n),这对于小地图没什么问题,但是对 ...
华硕ASUSPRO P5440UA笔记本电脑安装驱动
领了一台公司的办公笔记本,按照套路重装了系统(win10),后面发现悲剧了采坑1: 从华硕通过型号搜索下来的无线网卡(WIFI) 驱动无法安装(双击启动没有反映) 解决:通过设备Id上google搜 ...
streamsets
streamstes用户指南: https://streamsets.com/documentation/datacollector/latest/help/index.html#datacollec ...

[论文阅读]MobileNetV2: Inverted Residuals and Linear Bottlenecks

[论文阅读]MobileNetV2: Inverted Residuals and Linear Bottlenecks的更多相关文章

随机推荐

热门专题