深度学习卷积、全连接层、深度可分离层参数量和FLOPs计算公式

九叶草 2024-10-10 10:32:56 原文

卷积：

输入尺寸，卷积核的大小为 * ，输出的尺寸大小为 $C_{o} * H_{o} * W_{o}$

参数量

（1）不考虑bias：
（2）考虑bias：

FLOPs

（1）不考虑bias

解释：先计算输出的中一个元素需要的计算量，即括号这一部分，根据卷积的公式可知这部分为 * + * ,其中前一项表示做了的乘法次数，后一项表示这些乘法结果的相加次数，因为个数相加需要次。所以显然如果考虑bias的话刚好把这个给补回去。

（2）考虑bias

全连接

输入维度，输出

参数量

(1)不考虑bias：

(2)考虑bias：

FLOPs

这个很简单，全连接层就理解为一个矩阵，是矩阵行数，为列数，若不考虑bias,则先计算输出向量中的一个元素需要多少计算量，首先要做次乘法，然后做次加法。若考虑bias，则做的加法会多一次

（1）不考虑bias

（2）考虑bias

Depth-wise CNN（深度可分离卷积）

输入尺寸，卷积核的大小为 * ，输出的尺寸大小为 $C_{o} * H_{o} * W_{o}$ ：

深度可分离卷积的过程：

将普通卷积分为组，进行卷积的时候是没有普通卷积中在通道维度上求和的过程的
用一个的卷积核来进行通道融合，所以总的参数量和FLOPs计算如下

不考虑bias的情况下计算如下：

$\begin{aligned} paremeters &= K^2*C_i +C_i*C_o\\ FLOPs &= (2*K^2-1)*C_i*W_o*H_o+(2*C_i -1)*C_o*W_o*H_o \end{aligned}$

考虑bias的情况计算如下：

$\begin{aligned} paremeters &= K^2*C_i+C_i +C_i*C_o+C_o\\ FLOPs &= 2*K^2*C_i*H_o*W_o +2*C_i*C_o*H_o*W_o\\ &=2*(K^2+C_o)*C_i*W_o*H_o \end{aligned}$

深度学习卷积、全连接层、深度可分离层参数量和FLOPs计算公式的更多相关文章

对深度学习中全连接层、卷积层、感受野、1×1卷积、池化层、softmax层、全局平均池化的一些理解
1.全连接层在卷积神经网络中,在多个卷积层和池化层后,连接着1个或1个以上的全连接层,全连接层把卷积层和池化层提取出来的所有局部特征重新通过权值矩阵组装成一个完整的图,因为用到了所有的局部特征,所以 ...
深度学习之depthwise separable convolution,计算量及参数量
目录: 1.什么是depthwise separable convolution? 2.分析计算量.flops 3.参数量 4.与传统卷积比较 5.reference
深度学习原理与框架-卷积网络细节-图像分类与图像位置回归任务 1.模型加载 2.串接新的全连接层 3.使用SGD梯度对参数更新 4.模型结果测试 5.各个模型效果对比
对于图像的目标检测任务:通常分为目标的类别检测和目标的位置检测目标的类别检测使用的指标:准确率, 预测的结果是类别值,即cat 目标的位置检测使用的指标:欧式距离,预测的结果是(x, y, w, h ...
深度学习Keras框架笔记之Dense类(标准的一维全连接层)
深度学习Keras框架笔记之Dense类(标准的一维全连接层) 例: keras.layers.core.Dense(output_dim,init='glorot_uniform', activat ...
深度学习--全连接层、高阶应用、GPU加速
深度学习--全连接层.高阶应用.GPU加速 MSE均方差 Cross Entropy Loss:交叉熵损失 Entropy 熵: 1948年,香农将统计物理中熵的概念,引申到信道通信的过程中,从而开创 ...
深度学习基础系列（十）| Global Average Pooling是否可以替代全连接层？
Global Average Pooling(简称GAP,全局池化层)技术最早提出是在这篇论文(第3.2节)中,被认为是可以替代全连接层的一种新技术.在keras发布的经典模型中,可以看到不少模型甚至 ...
深度学习——卷积神经网络的经典网络（LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet）
一.CNN卷积神经网络的经典网络综述下面图片参照博客:http://blog.csdn.net/cyh_24/article/details/51440344 二.LeNet-5网络输入尺寸:32 ...
Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1
3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...
caffe中全卷积层和全连接层训练参数如何确定
今天来仔细讲一下卷基层和全连接层训练参数个数如何确定的问题.我们以Mnist为例,首先贴出网络配置文件: name: "LeNet" layer { name: "mni ...
fc全连接层的作用、卷积层的作用、pooling层、激活函数的作用
fc:1.起到分类器的作用.对前层的特征进行一个加权和,(卷积层是将数据输入映射到隐层特征空间)将特征空间通过线性变换映射到样本标记空间(也就是label) 2.1*1卷积等价于fc:跟原featur ...

随机推荐

Python编写html文件
背景:部门需要发送周报.月报,每次都需要去数据库导出数据整理统计发送给领导,人工操作显得繁琐且费时间. 1.可以定时用python将数据库查询数据结果写成html文件,达到浏览器访问的效果,定时发送给 ...
4、SpringBoot2之整合SpringMVC
创建名为springboot_springmvc的新module,过程参考3.1节 4.1.重要的配置参数在 spring boot 中,提供了许多和 web 相关的配置参数(详见官方文档),其中有 ...
iOS开发基础146-深入解析WKWebView
WKWebView是苹果在iOS 8中引入的重要组件,它替代了UIWebView,为开发者提供了高性能.高稳定性的网页显示和交互能力.在本文中,我们将深入探讨WKWebView的底层架构.关键特性.使 ...
预处理共轭梯度算法(Preconditioned Conjugate Gradients Method)的代码实现
前文: 预处理共轭梯度算法(Preconditioned Conjugate Gradients Method) 给出代码: import numpy as np # from rllab.misc. ...
【转载】你真的理解Python中MRO算法吗？
来自:www.xymlife.com 作者: XYM 链接:http://www.xymlife.com/2016/05/22/python_mro/ (点击阅读原文前往) ------------- ...
Kotlin 面向对象编程 (OOP) 基础：类、对象与继承详解
什么是面向对象编程 (OOP)? OOP 代表面向对象编程. 过程式编程是编写执行数据操作的过程或方法,而面向对象编程则是创建包含数据和方法的对象. 与过程式编程相比,面向对象编程具有以下几个优势: ...
shell脚本中exit命令
shell脚本中exit命令使用千次阅读 2020-09-30 10:19:54 exit命令用于退出当前shell,在shell脚本中可以终止当前脚本执行. $ exit --help exit: ...
k8s实践——命名空间隔离+request-key机制解决CSI内核态域名解析
0x01 背景 Pod需要使用远程存储的PV,由同k8s集群内的服务提供的存储服务.一开始的做法是: CSI中解析Service的clusterIP. 然后使用clusterIP挂载PV卷. 但因为走 ...
9k star 监控系统，100% 国产，推荐了解
前言监控系统的重要性不言而喻,国内用的最多的应该是 Zabbix 和 Prometheus,其优缺点: Zabbix 是资产管理式,监控数据存在数据库中,擅长设备监控,不擅长微服务和云原生环境的监控 ...
LLM应用实战: 产业治理多标签分类
1. 背景许久未见,甚是想念~ 近期本qiang~换了工作,处于新业务适应期,因此文章有一段时间未更新,理解万岁! 现在正在着手的工作是产业治理方面,主要负责其中一个功能模块,即按照产业治理标准体系 ...