金字塔卷积：Pyramidal Convolution

论文地址：https://arxiv.org/pdf/2006.11538.pdf

作者认为，当前CNN主要存在两个不足：（1）实际的感受野不足；（2）在下采样中，很多的细节信息会丢失。

从图中可以看出，有的物体尺寸较大（建筑、沙发），有的物体尺寸较小（行人，书本）。这种尺寸的变化是标准卷积级经捕获的。为此，作者提出了金字塔卷积（Pyramid Convolution, PyConv），包含不同尺度的卷积核，可以提取多尺度信息，在多个任务上均取得了较好的性能

PyConv 的示意如图所示，直观来看，就是从上往下卷积核的大小依次减小，同时，在通道维度上，通道的数目依次增加。最后将得到的 feature map 拼接起来。

在图像分类任务中的 PyConv 示意所图所示，首先是9X9的卷积，16个卷积核，分为16组，因此生成16X16=256个 feature map；然后是7X7的卷积，16个卷积核，分为8组，因此生成16X8=128个 feature map；接着是5X5的卷积，16个卷积核，分为4组，因此生成16X4=64个 feature map；最后是3X3的卷积，16个卷积核，只有1组，因此生成16X1=16个 feature map。然后，会用1X1的卷积来使输出的维度都为 256。

备汪：关于分组卷积，网上有一个比较形象的图示。对于普通卷积，如果输入的 feature map 尺寸为CHW，卷积核的数量为N，每个卷积核的尺寸为CxKxK，那么输出的 feature map 尺寸为 CHN，总的参数量为：NxCxKxK 。

如果进行分组卷积，假定要分成 G 组，每组输入的 feature map 数量为 \(\frac{C}{G}\)，每组输出的 feature map 数量为 \(\frac{N}{G}\)，每个卷积核的尺寸为\(\frac{C}{G}\times K\times K\), 每组的卷积核数量为 \(\frac{N}{G}\)，卷积核只与同组的输入进行卷积，则总的参数量为 \(N\times \frac{C}{G} \times K \times K\)，则总的参数量减少为以前的 \(\frac{1}{G}\)。

当分组数量等于输入map数量，输出map数量也等于输入map的数量，即 G=N=C，每个卷积核尺寸为\(1\times K \times K\)时，就成了 Depthwise convolution。

金字塔卷积 PyConv，通过集成不同尺度的卷积核，提升了多个视觉任务的性能，同时，该模块是一种“即插即用”的模块，可以较好的嵌入不同的网络架构中。

金字塔卷积：Pyramidal Convolution的更多相关文章

从图(Graph)到图卷积(Graph Convolution)：漫谈图神经网络模型 (二)
本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...
从图(Graph)到图卷积(Graph Convolution)：漫谈图神经网络模型 (一)
本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...
卷积（convolution）与相关（correlation）（matlab 实现）
1. 卷积(convolution) 输出 y(n) 是作为在 x(k) 和 h(n−k)(反转和移位)重叠之下的样本和求出的. 考虑下面两个序列: x(n)=[3,11,7,0,−1,4,2],−3 ...
从图(Graph)到图卷积(Graph Convolution)：漫谈图神经网络模型 (三)
本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...
【论文笔记】Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition
地址:https://arxiv.org/pdf/2006.11538.pdf github:https://github.com/iduta/pyconv 目前的卷积神经网络普遍使用3×3的卷积神经 ...
转置卷积Transposed Convolution
转置卷积Transposed Convolution 我们为卷积神经网络引入的层,包括卷积层和池层,通常会减小输入的宽度和高度,或者保持不变.然而,语义分割和生成对抗网络等应用程序需要预测每个像素的值 ...
信号处理——卷积（convolution）的实现
作者:桂. 时间:2017-03-07 22:33:37 链接:http://www.cnblogs.com/xingshansi/p/6517301.html 前言信号时域.频域对应关系,及其D ...
各种卷积类型Convolution
从最开始的卷积层,发展至今,卷积已不再是当初的卷积,而是一个研究方向.在反卷积这篇博客中,介绍了一些常见的卷积的关系,本篇博客就是要梳理这些有趣的卷积结构. 阅读本篇博客之前,建议将这篇博客结合在一起 ...
[翻译] 扩张卷积 (Dilated Convolution)
英文原文: Dilated Convolution 简单来说,扩张卷积只是运用卷积到一个指定间隔的输入．按照这个定义,给定我们的输入是一个2维图片,扩张率 k=1 是通常的卷积,k=2 的意思是每个输 ...

随机推荐

cbitmap 获取RGB
CBitMap的用法 MFC提供了位图处理的基础类CBitmap,可以完成位图(bmp图像)的创建.图像数据的获取等功能.虽然功能比较少,但是在对位图进行一些简单的处理时,CBitmap类还是可以 ...
.NET Core WEB API接口参数模型绑定
.NET Core WEB API 模型绑定方式有以下表格中的几种: 特性绑定源 [FromHeader] 请求标头 [FromQuery] 请求查询字符串参数 [FromForm] 请求正文中的表 ...
python冷知识
目录省略号也是对象奇怪的字符串 and 和 or 的取值顺序访问类中的私有方法时有时无的切片异常两次 return for 死循环 intern机制省略号也是对象在python中一切皆对 ...
Linux中快捷生成自签名ssl证书_113资讯网
一.生成CA私钥 mkdir ca cd ca #创建私钥 (建议设置密码) openssl genrsa -des3 -out myCA.key 2048 生成CA证书 # 20 年有效期 open ...
利用Chrome浏览器调试线上代码
前言之前调试前端bug都是在开发环境中做完并多次测试没有问题之后发布测试环境,验收合格之后发布生产.但生产环境偏偏会有和开发和测试环境不一致的情况,例如测试环境需要加密,而开发环境先不加密,测试环境 ...
使用Python编写的对拍程序
简介支持数据生成程序模式, 只要有RE或者WA的数据点, 就会停止支持数据文件模式, 使用通配符指定输入文件, 将会对拍所有文件结束后将会打印统计信息第一次在某目录执行,将会通过交互方式获取配 ...
Python 数字格式转换
# 数字格式转换v1 '''a = input() a1 = list(a) b = ["零", "一", "二", "三&quo ...
linux常用命令总结
最最常用的快捷键,Tab 键 ,自动补全功能, / 根目录 man 帮助手册:man cd ,查看cd的用法! cd 进入目录:ls -l 列表查看文件详细信息:pwd 当前路径: cp 复制 .rm ...
JavaScript学习 Ⅶ
十四. DOM(文档对象模型) 节点:Node--构成HTML文档最基本的单元文档节点:整个HTML文档元素节点:HTMl文档中的HTML标签属性节点:元素的属性文本节点:HTML标签中的文本 ...
python eval函数，将列表样式的字符串转化为列表
python eval函数,将列表样式的字符串转化为列表 >>> str_1 = '[1,2,3,4,5,6]'>>> type(str_1)<type 's ...

金字塔卷积：Pyramidal Convolution

金字塔卷积：Pyramidal Convolution的更多相关文章

随机推荐

热门专题