Winograd Convolution 推导 - 从1D到2D

姚伟峰 2024-09-06 19:40:37 原文

Winograd Convolution 推导 - 从1D到2D

姚伟峰
 http://www.cnblogs.com/Matrix_Yao/

Winograd Convolution 推导 - 从1D到2D

1D Winograd 卷积

1D Winograd算法已经有很多文章讨论了，讨论得都比较清楚，这里就不再赘述，仅列出结论。

输入：四维信号
卷积核：三维向量
输出：二维信号
则可表示为：

其中：

2D Winograd卷积

2D Winograd可以由1D Winograd外推得到，因此为解决2D Winograd问题，首先要重温1D 卷积解决的问题。在此复述一遍：
假设一个卷积核尺寸为3的一维卷积，假设每次我们输出2个卷积点，则我们形式化此问题：F(2, 3)。
因为输出为2，卷积核大小为3，对应的输入点数应该为4，则此问题表述为：

输入：四维信号
卷积核：三维向量
因此，此卷积的矩阵乘形式应为：

请记住这个形式是Winograd算法解决的问题，后续2D算法将化归为这个问题。
下面我们来定义2D 卷积问题，将1D卷积扩展一维：
假设一个卷积核尺寸为3x3的二维卷积，假设每次我们输出2x2个卷积点，则我们形式化此问题：F(2x2, 3x3)。
因为输出为2x2，卷积核大小为3x3，对应的输入点数应该为4x4，则此问题表述为：

输入：

卷积核：

因此，此卷积的矩阵乘形式应为：

从这个式子里，我们可以看到1D卷积的影子，这个影子在我们对矩阵作了分块后会更加明显。

再明显一点，我们写成分块矩阵乘的形式：

至此，我们对2D卷积推导出了跟1D形式一致的公式，只不过1D中的标量在2D中变成了小矩阵或者向量。

实操粉

对实操粉而言，到这个形式为止，已经可以写代码了。
由1D Winograd可知，我们可以将该式改写为Winograd形式, 如下：

其中：

注意，这四个M的计算又可以用一维的F(2, 3) Winograd来做，因此2D Winograd是个嵌套(nested)的算法。

理论粉

对一个有追求的理论粉来说，只是得到可以写程序的递归表达肯定是不完美的，他们还是希望有一个最终的解析表达的。其实也很简单，我们把上面的式子规整规整，使得输出成为一个标准的2x2矩阵，有：

可以写为：

依1D Winograd公式, 并结合各M的公式，有下式。

注意到像这些都是2维列向量，hadamard product和concat可以交换而不影响结果，因此：

至此证得。

参考文献

Fast Algorithms for Convolutional Neural Networkse
Fast Algorithms for Signal Processing
Going beyond Full Utilization: The Inside Scoop on Nervana’s Winograd Kernels
卷积神经网络中的Winograd快速卷积算法 注：本文关于2D Winograd的公式推导是错误的。

Winograd Convolution 推导 - 从1D到2D的更多相关文章

卷积神经网络中的Winograd快速卷积算法
目录写在前面问题定义一个例子 F(2, 3) 1D winograd 1D to 2D,F(2, 3) to F(2x2, 3x3) 卷积神经网络中的Winograd 总结参考博客:blog ...
AES128加密-S盒和逆S盒构造推导及代码实现
文档引用了<密码编码学与网络安全--原理和实践>里边的推导过程,如有不妥,请与我联系修改. 文档<FIPS 197>高级加密标准AES,里边有个S盒构造,涉及到了数论和有限域的 ...
1D Blending
[1D Blending] BlendTree有类型之分,分为1D.2D.本文记录1D. 1D Blending blends the child motions according to a sin ...
Notes on Convolutional Neural Networks
这是Jake Bouvrie在2006年写的关于CNN的训练原理,虽然文献老了点,不过对理解经典CNN的训练过程还是很有帮助的.该作者是剑桥的研究认知科学的.翻译如有不对之处,还望告知,我好及时改正, ...
NumPy的详细教程
原文 http://blog.csdn.net/lsjseu/article/details/20359201 主题 NumPy 先决条件在阅读这个教程之前,你多少需要知道点python.如果你想 ...
KCF目标跟踪方法分析与总结
KCF目标跟踪方法分析与总结 correlation filter Kernelized correlation filter tracking 读"J. F. Henriques, R. ...
TensorFlow框架(4)之CNN卷积神经网络
1. 卷积神经网络 1.1 多层前馈神经网络多层前馈神经网络是指在多层的神经网络中,每层神经元与下一层神经元完全互连,神经元之间不存在同层连接,也不存在跨层连接的情况,如图 11所示. 图 11 对 ...
论文阅读笔记十九：PIXEL DECONVOLUTIONAL NETWORKS(CVPR2017)
论文源址:https://arxiv.org/abs/1705.06820 tensorflow(github): https://github.com/HongyangGao/PixelDCN 基于 ...
CNN 文本分类
谈到文本分类,就不得不谈谈CNN(Convolutional Neural Networks).这个经典的结构在文本分类中取得了不俗的结果,而运用在这里的卷积可以分为1d .2d甚至是3d的. 下面 ...

随机推荐

【Javascript】数组之二
Array 对象方法方法描述 concat() 连接两个或更多的数组,并返回结果. copyWithin() 从数组的指定位置拷贝元素到数组的另一个指定位置中. entries() 返回数组的可迭 ...
python基础：zip和dict详解
一.zip函数:接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表. 1.示例1: x = [1, 2, 3] y = [4, 5, 6] z = [7, 8, 9] xyz = zi ...
Java逆变(Covariant)和协变(Contravariant)
1. 定义逆变和协变描述的经过类型变换后的类型之间的关系.假如A和B表示类型,f表示类型变换,A ≤B表示A是B的子类型,那么如果A ≤B,f(A) ≤f(B),那么f是协变如果A ≤B,f(B ...
C程序运行原理
计算机不能直接识别和执行高级语言写的命令,必须用编译程序(也称编译器)把C源程序翻译成二进制形式的目标程序,然后再将该目标程序与系统的函数库以及其他目标程序连接起来,形成可执行的目标程序 C语言的编译 ...
使用flow来规范javascript的变量类型
众所周知, js是弱类型的语言,由此有了很多的优点,也出现了大量由此导致的错误,难以定位.当然有类似于ts之类的语法糖来解决此问题,ts因为是从c#演变而来的,所以入门有一定的门槛,所以我们来一下fl ...
使用plotly dash-component-boilerplate 生成自己的组件
plotly 基于dash-component-boilerplate给我们提供了可以快速生成基于使用python 调用的react 组件以下是一个简单的使用脚手架生成一个组件,同时可以了解组件的工 ...
C# VS常用操作
VS点击项目,就会打开文件,其实我只是想选中而已, 在这个地方可以改. 原文:https://blog.csdn.net/yellowegg/article/details/12217309
为什么vue组件中的data不是一个对象而是一个函数
如果两个实例引用同一个对象,当其中一个实例的属性发生改变时,另一个实例属性也随之改变,只有当两个实例拥有自己的作用域时,才不会相互干扰. 这是因为JavaScript的特性所导致,在component ...
AGC010
AGC010 A [过水已隐藏] B 这题推完了还是不会/kk真的毒瘤考虑每次会减少的总和是\(n(n+1)/2\),用原来的和除以这个可以得到操作次数\(m\)(不是整数无解) 再考虑相邻两个数\ ...
markdown转html
今天临时要写接口文档,然后发现部门给的文档是markdown文件的,而接口文档是要html格式的,因此想直接把markdown转为html 这里我使用的是marked 首先初始化一个node项目 np ...