『PyTorch』矩阵乘法总结

芜情 2024-09-09 07:19:38 原文

1. 二维矩阵乘法 torch.mm()

torch.mm(mat1, mat2, out=None)，其中mat1(\(n\times m\))，mat2(\(m\times d\))，输出out的维度是(\(n\times d\))。

该函数一般只用来计算两个二维矩阵的矩阵乘法，并且不支持broadcast操作。

2. 三维带batch的矩阵乘法 torch.bmm()

由于神经网络训练一般采用mini-batch，经常输入的时三维带batch的矩阵，所以提供torch.bmm(bmat1, bmat2, out=None)，其中bmat1(\(b\times n \times m\))，bmat2(\(b\times m \times d\))，输出out的维度是(\(b \times n \times d\))。

该函数的两个输入必须是三维矩阵且第一维相同（表示Batch维度），不支持broadcast操作。

3. 多维矩阵乘法 torch.matmul()

torch.matmul(input, other, out=None)支持broadcast操作，使用起来比较复杂。

针对多维数据 matmul()乘法，我们可以认为该matmul()乘法使用使用两个参数的后两个维度来计算，其他的维度都可以认为是batch维度。假设两个输入的维度分别是input(\(1000 \times 500 \times 99 \times 11\)), other(\(500 \times 11 \times 99\))那么我们可以认为torch.matmul(input, other, out=None)乘法首先是进行后两位矩阵乘法得到\((99 \times 11) \times (11 \times 99)\Rightarrow(99 \times 99)\) ，然后分析两个参数的batch size分别是 \(( 1000 \times 500)\) 和 \(500\) , 可以广播成为 \((1000 \times 500)\)，因此最终输出的维度是(\(1000 \times 500 \times 99 \times 99\))。

4. 矩阵逐元素(Element-wise)乘法 torch.mul()

torch.mul(mat1, other, out=None)，其中other乘数可以是标量，也可以是任意维度的矩阵，只要满足最终相乘是可以broadcast的即可

5. 两个运算符 @ 和 *

@：矩阵乘法，自动执行适合的矩阵乘法函数
*：element-wise乘法

『PyTorch』矩阵乘法总结的更多相关文章

『PyTorch』第二弹重置_Tensor对象
『PyTorch』第二弹_张量 Tensor基础操作简单的初始化 import torch as t Tensor基础操作 # 构建张量空间,不初始化 x = t.Tensor(5,3) x -2. ...
『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...
『PyTorch』第九弹_前馈网络简化写法
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下在前面的例子中,基本上都是将每一层的输出直接作为下一层的 ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『PyTorch』第三弹重置_Variable对象
『PyTorch』第三弹_自动求导 torch.autograd.Variable是Autograd的核心类,它封装了Tensor,并整合了反向传播的相关实现 Varibale包含三个属性: data ...
『PyTorch』第十弹_循环神经网络
RNN基础: 『cs231n』作业3问题1选讲_通过代码理解RNN&图像标注训练 TensorFlow RNN: 『TensotFlow』基础RNN网络分类问题『TensotFlow』基础R ...
『PyTorch』第五弹_深入理解Tensor对象_下：从内存看Tensor
Tensor存储结构如下, 如图所示,实际上很可能多个信息区对应于同一个存储区,也就是上一节我们说到的,初始化或者普通索引时经常会有这种情况. 一.几种共享内存的情况 view a = t.arang ...
『PyTorch』第五弹_深入理解autograd_上：Variable属性方法
在PyTorch中计算图的特点可总结如下: autograd根据用户对variable的操作构建其计算图.对变量的操作抽象为Function. 对于那些不是任何函数(Function)的输出,由用户创 ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上
总结一下相关概念: torch.Tensor - 一个近似多维数组的数据结构 autograd.Variable - 改变Tensor并且记录下来操作的历史记录.和Tensor拥有相同的API,以及b ...

随机推荐

NOIP 模拟 10 考试总结
T1 一道很妙的题,打暴力分也很多,但是考试的时候忘开 long long 了. 题解 T2 一道挺水的题,不过...(打挂了) 题解 T3 此题甚妙,转化真多,不过对思维是一个非常大的扩展题解考 ...
FPGA学习过程（一）
前言终于有时间折腾这块fpga开发板了,不知不觉又熬夜了. 正文实现一个呼吸灯的项目打开quartus ii 建立工程步骤就不讲了新建一个pwm.v文件内容 module PWM ( inp ...
【译】flutter中如何较好地实现隐藏和显示widget
通常情况下,显示有四种情况: 1.(visible)显示 2.(invisible)隐藏: 这种隐藏是指在屏幕中占据空间,只是没有显示.这种情况出现场景如:用带有背景色的Container Widge ...
beeline: 新版连接Hive server的工具
HiveServer2 支持一个新的命令行Shell,称为Beeline,它是基于SQLLine CLI的JDBC客户端.它是从 Hive 0.11版本引入的,是Hive新的命令行客户端工具.Hive ...
Linux 第一个静态库（两种方法）
方法1 --------------------------------------------- Linux下静态库一般为.a为扩展名类似 lib***.a 的文件名.利用静态函数库编译 ...
深入Pulsar Consumer的使用方式&源码分析
原文链接 1.使用前准备引入依赖: <dependency> <groupId>org.apache.pulsar</groupId> <artifactI ...
js在不同页面的导航背景不同（设置网站公共头的导航）
<script type="text/javascript" src="js/jquery.min.js"></script> < ...
（1）RabbitMQ在Docker上安装
1.简介在来学习RabbitMQ时候,我觉得很有必要先把它的环境先搭建起来,这样后面的示例才能进行.因为之前自己手动在Linux服务器上搭建过Elasticsearch,当时踩过太多坑了,浪费太多时 ...
启动线程组报错：Error occurred starting thread group :test_1, error message:Invalid duration 0 set in Thread Group:test_1, see log file for more details
线程组基础信息都已经配置好,启动时报错,如下图: 排查原因:勾选了线程组调度器,并未设置参数解决方案:取消勾选或者设置参数
史上最全git命令集
配置化命令 git config --global user.name "Your Name" git config --global user.email "email ...