MobilNnet

一、参数数量和理论计算量

1、定义

参数数量（params）：关系到模型大小，单位通常为M，通常参数用 float32 表示，也就是每个参数占4个字节，所以模型大小是参数数量的 4 倍
理论计算量（FLOPs）：
- 是 floating point operations 的缩写（注意 s 小写），可以用来衡量算法/模型的复杂度，这关系到算法速度，大模型的单位通常为 G，小模型单位通常为 M
- 通常只考虑乘加操作(Multi-Adds)的数量，而且只考虑 CONV 和 FC 等参数层的计算量，忽略 BN 和PReLU 等等。一般情况，CONV 和 FC 层也会忽略仅纯加操作 的计算量，如 bias 偏置加和 shotcut 残差加等，目前技术有 BN 的 CNN 可以不加 bias

2、计算公式

假设卷积核大小为 K_h× K_w，输入通道数为 C_in x C_out，输出特征图的宽 W 和高 H，忽略偏置。

CONV 标准卷积层：
- 参数量就是kernel*kernel*channel_input*channel_output，卷积核的大小x通道数量x卷积核的个数
- ，输入通道数等于一个卷积核的通道数，输出通道数=卷积核的个数
- 计算量：kernel*kernel*next_featuremap_height*next_featuremap_wight*channel_input*channel_output

FC 全连接层（相当于 k=1,输入输出都不是二维图像，都是单个点）：

参数量等于计算量，因为输入输出都不能使二维平面，而是向量
，C相当于一个一张图片展成一条线上的所有点，也就是所有的像素点

参数量取决于显存大小，计算量要求芯片的floaps（gpu的运算能力）

二、MobileNetV1: Efficient Convolutional Neural Networks for Mobile Vision Applications

1、能够减少参数数量和计算量的原理

深度可分离卷积的使用

在进行 depthwise 卷积时只使用了一种维度为in_channels的卷积核进行特征提取（没有进行特征组合）
在进行 pointwise 卷积时只使用了output_channels 种维度为in_channels 1*1 的卷积核进行特征组合，普通卷积不同 depth 层的权重是按照 1:1:1…:1的比例进行相加的，而在这里不同 depth 层的权重是按照**不同比例(可学习的参数)**进行相加的
参数数量由原来的 --》p2 = F*F*in_channels*1 + 1*1*in_channels*output_channels参数量减小为原来的p2/p1，当F=3的时候，大概为1/9

深度卷积参数量=卷积核尺寸 x 卷积核通道数1 x 卷积核个数（就是输入通道数）；
点卷积（普通卷积）参数量=卷积核尺寸1x1 x 卷积核通道数就是输入通道数 x 卷积核的个数（即输出通道数）

Note：原论文中对第一层没有用此卷积，深度可分离卷积中的每一个后面都跟 BN 和 RELU
Global Average Pooling 的使用：这一层没有参数，计算量可以忽略不计
用 CONV/s2（步进2的卷积）代替 MaxPool+CONV：使得参数数量不变，计算量变为原来的 1/4 左右，且省去了MaxPool 的计算量
Note：采用 depth-wise convolution 会有一个问题，就是导致信息流通不畅，即输出的 feature map 仅包含输入的 feature map 的一部分，在这里，MobileNet 采用了 point-wise(1*1) convolution 帮助信息在通道之间流通

2、MobileNetV1 中引入的两个超参数

Width Multiplier(α \alphaα): Thinner Models

Resolution Multiplier(ρ \rhoρ): Reduced Representation

3、标准卷积和深度可分离卷积的区别

三、MobileNetV2：Inverted Residuals and Linear Bottlenecks

1、主要改进点

引入残差结构，先升维（先1x1卷积，输出特征图的通道数增加）再降维（再3x3和1x1），增强梯度的传播，显著减少推理期间所需的内存占用（Inverted Residuals）
去掉 Narrow layer（low dimension or depth）后的 ReLU，保留特征多样性，增强网络的表达能力（Linear Bottlenecks）
网络为全卷积的，使得模型可以适应不同尺寸的图像；使用 RELU6（最高输出为 6）激活函数，使得模型在低精度计算下具有更强的鲁棒性

MobileNetV2 building block 如下所示，若需要下采样，可在 DWise 时采用步长为 2 的卷积；小网络使用小的扩张系数（expansion factor），大网络使用大一点的扩张系数（expansion factor），推荐是5~10，论文中 t=6 t = 6t=6

2、和 MobileNetV1 的区别

3、和 ResNet 的区别

MobilNnet的更多相关文章

随机推荐

POJ 3281 Dining[网络流]
Cows are such finicky eaters. Each cow has a preference for certain foods and drinks, and she will c ...
BZOJ 2527 [POI2011]MET-Meteors (整体二分+树状数组)
题目大意:略洛谷传送门整体二分裸题考虑只有一个国家的情况如何处理对询问数量二分答案,暴力$O(m)$打差分,求前缀和验证,时间是$O(mlogK)$ 如果有$n$个国家,就是$O(nmlogK ...
MySQL 获取无限级某级的全路径
传递参数:文件夹ID DROP FUNCTION IF EXISTS RecursionFolderFullPath; CREATE FUNCTION RecursionFolderFullPath( ...
搞定PHP面试 - 运算符知识点整理
一.算术运算符 1. 概览例子名称结果 $a + $b 加法 $a 和 $b 的和. $a - $b 减法 $a 和 $b 的差. $a * $b 乘法 $a 和 $b 的积. $a / $b ...
【codeforces 799A】Carrot Cakes
[题目链接]:http://codeforces.com/contest/799/problem/A [题意] 你有一个烤炉; 每t秒能同时烤出k个蛋糕; 你可以在第一个烤炉在烤的时候;同时花费d秒建 ...
CodeForcesGym 100641E Inspectors
Inspectors Time Limit: 1000ms Memory Limit: 262144KB This problem will be judged on CodeForcesGym. O ...
Global UNIX file system cylinder group cache
A global cylinder group (CG) cache is stored in file server memory and shared by a plurality of file ...
Codeforces Round #136 (Div. 1) B. Little Elephant and Array
B. Little Elephant and Array time limit per test 4 seconds memory limit per test 256 megabytes input ...
[HTML 5] Styling with ARIA
See if you can do a better job styling this button using ARIA states. One huge benefit to styling wi ...
逆向学习XXclient怎样仅仅执行一个实例
个人觉得学习分两种, 一种是当面请教和直接从书本网络中的资料学习. 其二就是看着令你惊叹的作品-顿悟. 什么?顿悟不了?那我们就一起来逆向学习吧!差点忘了,我并不打算提供Demo,这并不重要,难道你打 ...