pytorch torch.Storage学习

tensor分为头信息区（Tensor）和存储区（Storage）

信息区主要保存着tensor的形状（size）、步长（stride）、数据类型（type）等信息，而真正的数据则保存成连续数组，存储在存储区

因为数据动辄成千上万，因此信息区元素占用内存较少，主要内存占用取决于tensor中元素的数目，即存储区的大小

一般来说，一个tensor有着与之相对应的storage，storage是在data之上封装的接口，便于使用

不同的tensor的头信息一般不同，但是可能使用相同的storage

生成a:

a = t.arange(0,6)

a.storage()

⚠️将这里改成a = t.arange(0,6).float()，用来保证得到的值的类型为FloatTensor

这跟下面遇见的一个问题相关，可以看到下面了解一下，然后再跟着操作

所以你的下面内容的值的类型应该为FloatTensor类型，我的仍是LongTensor，因为我没有改过来

0

 1

 2

 3

 4

 5

[torch.LongStorage of size 6]

生成b:

b = a.view(2,3)

b.storage()

 0

 1

 2

 3

 4

 5

[torch.LongStorage of size 6]

对比两者内存地址：

#一个对象的id值可以看作她的内存空间

#a,b storage的内存地址一样，即是同一个storage

id(a.storage()) == id(b.storage())

True

改变某个值查看是否共享内存：

#a改变，b也随之改变，因为他们共享storage，即内存

a[1] = 100

b

tensor([[  0, 100,   2],

        [  3,   4,   5]])

生成c:

#c从a的后两个元素取起

c = a[2:]

c.storage()#指向相同

 0

 100

 2

 3

 4

 5

[torch.LongStorage of size 6]

查看其首元素内存地址：

c.data_ptr(), a.data_ptr() #data_ptr返回tensor首元素的内存地址

#从结果可以看出两者的地址相差16

#因为c是从a第二个元素选起的，每个元素占8个字节，因为a的值的类型是int64

(140707162378192, 140707162378176)

因为查看后a的类型为int64:

a.dtype

torch.int64

更改c:

c[0] = -100 #a,c也共享内存空间，c[0]的内存地址对应的是a[2]的内存地址

a

tensor([   0,  100, -100,    3,    4,    5])

使用storage来生成新tensor：

d = t.Tensor(c.storage())#这样a,b,c,d共享同样的内存空间

d[0] = 6666

b

⚠️报错：

RuntimeError: Expected object of data type 6 but got data type 4 for argument #2 'source'

这是因为Tensor期待得到的值的类型是FloatTensor（类型6），而不是其他类型LongTensor(data type 4)

因为如果生成：

dtypea = t.FloatTensor([[1, 2, 3], [4, 5, 6]])

dtypea.storage()

 1.0

 2.0

 3.0

 4.0

 5.0

 6.0

[torch.FloatStorage of size 6]

再运行就成功了：

d = t.Tensor(dtypea.storage())#这样a,b,c,d共享同样的内存空间

d[0] = 6666

dtypea

tensor([[6.6660e+03, 2.0000e+00, 3.0000e+00],

        [4.0000e+00, 5.0000e+00, 6.0000e+00]])

如果使用的是IntTensor（data type 3）,也会报错：

RuntimeError: Expected object of data type 6 but got data type 3 for argument #2 'source'

ShortTensor(data type 2),CharTensor(data type 1),ByteTensor(data type 0),DoubleTensor(data type 7)

下面的操作会在将上面的值改成FloatTensor的基础上进行，即在a = t.arange(0,6)后面添加.float()，然后从头执行了一遍

d = t.Tensor(c.storage())#这样a,b,c,d共享同样的内存空间

d[0] = 6666

b

tensor([[ 6.6660e+03,  1.0000e+02, -1.0000e+02],

        [ 3.0000e+00,  4.0000e+00,  5.0000e+00]])

判断是否共享内存：

#因此a,b,c,d这4个tensor共享storage

id(a.storage()) ==id(b.storage()) ==id(c.storage()) ==id(d.storage())#返回True

偏移量：

#获取首元素相对于storage地址的偏移量

a.storage_offset(), c.storage_offset(), d.storage_offset()

(0, 2, 0)

即使使用索引只获得一部分值，指向仍是storage：

#隔两行/列取元素来生成e

e = b[::2,::2]

print(e)

print(e.storage_offset())

id(e.storage()) ==id(a.storage()) #虽然值不相同，但是得到的storage是相同的

tensor([[6666., -100.]])

0

Out[44]:

True

步长信息：是有层次结构的步长

#获得步长信息

b.stride(), e.stride()

((3, 1), (6, 2))

查看空间是否连续：

#查看其值的内存空间是否连续

#因为e只取得了storage中的部分值，因此其是不连续的

b.is_contiguous(), e.is_contiguous()

(True, False)

从上面的操作中我们可以看出绝大多数的操作并不修改tensor的数据，即存储区的内容，只是修改了头信息区的内容

这种做法更节省内存，同时提升了处理速度

但是我们可以看见e的操作导致其不连续，这时候可以调用tensor.contiguous()方法将他们变成连续的数据。该方法是复制数据到新的内存中，不再与原来的数据共享storage，如：

e.contiguous().is_contiguous() #返回True

生成f:

print(e.data_ptr())

f = e.contiguous()

print(f.data_ptr()) #可见为f新分配了内存空间

print(f)

print(f.storage())#内存空间中只有两个值

print(f.size())

print(e.data_ptr()) #e指向的内存没有改变

f.is_contiguous() #这里的f的内存空间是连续的

140707203003760

140707160267104

tensor([[6666., -100.]])

 6666.0

 -100.0

[torch.FloatStorage of size 2]

torch.Size([1, 2])

140707203003760

Out[56]:

True

是否为连续内存空间有什么影响？
比如当你想要使用.view()转换tensor的形状时，如果该tensor的内存空间不是连续的则会报错：

k = t.arange(0,6).view(2,3).float().t()#进行转置，转置后的k内存是不连续的

k.is_contiguous()

k.view(-1)

报错：

RuntimeError: invalid argument 2: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces). Call .contiguous() before .view(). at /Users/soumith/mc3build/conda-bld/pytorch_1549593514549/work/aten/src/TH/generic/THTensor.cpp:213

报错的意思也是要求在.view()之前调用.contiguous(),改后为：

k = t.arange(0,6).view(2,3).float().t()#进行转置，转置后的k内存是不连续的

k.is_contiguous()

k.contiguous().view(-1)

成功返回：

tensor([0., 3., 1., 4., 2., 5.])

pytorch torch.Storage学习的更多相关文章

PyTorch : torch.nn.xxx 和 torch.nn.functional.xxx
PyTorch : torch.nn.xxx 和 torch.nn.functional.xxx 在写 PyTorch 代码时,我们会发现一些功能重复的操作,比如卷积.激活.池化等操作.这些操作分别可 ...
Note | PyTorch官方教程学习笔记
目录 1. 快速入门PYTORCH 1.1. 什么是PyTorch 1.1.1. 基础概念 1.1.2. 与NumPy之间的桥梁 1.2. Autograd: Automatic Differenti ...
pytorch torch.Stroage();torch.cuda()
转自:https://ptorch.com/news/52.html torch.Storage是单个数据类型的连续的一维数组,每个torch.Tensor都具有相同数据类型的相应存储.他是torch ...
使用PyTorch进行迁移学习
概述迁移学习可以改变你建立机器学习和深度学习模型的方式了解如何使用PyTorch进行迁移学习,以及如何将其与使用预训练的模型联系起来我们将使用真实世界的数据集,并比较使用卷积神经网络(CNNs) ...
Pytorch线性规划模型学习笔记(一)
Pytorch线性规划模型学习笔记(一) Pytorch视频学习资料参考:<PyTorch深度学习实践>完结合集 Pytorch搭建神经网络的四大部分 1. 准备数据 Prepare d ...
pytorch 测试迁移学习
训练源码: 源码仓库:https://github.com/pytorch/tutorials 迁移学习测试代码:tutorials/beginner_source/transfer_learning ...
torch Tensor学习：切片操作
torch Tensor学习:切片操作 torch Tensor Slice 一直使用的是matlab处理矩阵,想从matlab转到lua+torch上,然而在matrix处理上遇到了好多类型不匹配问 ...
torch 深度学习(5)
torch 深度学习(5) mnist torch siamese deep-learning 这篇文章主要是想使用torch学习并理解如何构建siamese network. siamese net ...
torch 深度学习(4)
torch 深度学习(4) test doall files 经过数据的预处理.模型创建.损失函数定义以及模型的训练,现在可以使用训练好的模型对测试集进行测试了.测试模块比训练模块简单的多,只需调用模 ...

随机推荐

next.js学习笔记
github地址: https://github.com/zeit/next.js#fetching-data-and-component-lifecycle 简介 Next.js是一个用于React ...
js 处理金额各个位数上的值
//金额处理 var number = 1234567.35; if (parseInt(number) == number) { var money = number.toString().spli ...
JavaScript中的let和const
在ES6之前,JavaScript中只有两种作用域:全局作用域和函数内部的局部作用域.ES6中新增了两个重要的关键字,let和const,从而引入了块级作用域. 关键字var 使用var关键字声明的变 ...
net core webApi返回值
1 多个参数采用结构的形式,如class xyz 2 返回值使用IActionResult 控制,不能使用httpRequestMessage类型 3 url为路由名称+Controller前缀如下 ...
Xcode常用的文件路径
1.Provisioning Profile文件在哪找? ~/Library/MobileDevice/Provisioning Profiles 2.master 在那找? ~/.cocoapods
F5负载的应用IIS日志记录的不是真实IP的处理方法
如果没有这一项,在服务里添加上将F5XForwardedFor.dll拷贝到应用目录下添加筛选器: 名称:F5XForwardedFor 可执行文件:F5XForwardedFor.dll所在的目 ...
Java虚拟机（四）垃圾收集算法
前言在本系列上一篇文章中我讲到了垃圾标记算法,垃圾被标记后,GC就会对垃圾进行收集,垃圾收集有很多种算法,这篇文章就来介绍常用的垃圾收集算法的思想. 1.标记-清除算法标记-清除算法(Mark-S ...
性能优化4--Bitmap内存优化
1.Bitmap在Android虚拟机中的内存分配在Android3.0之前,Bitmap的内存分配分为两部分,一部分是分配在Dalvik的VM堆中.而像素数据的内存是分配在Native堆中,而到了 ...
[20190320]测试相同语句遇到导致cursor pin S的情况.txt
[20190320]测试相同语句遇到导致cursor pin S的情况.txt --//前面测试链接:http://blog.itpub.net/267265/viewspace-2636342/-- ...
如何实现javascript js 类命名空间的写法
转载猫猫小屋http://www.maomao365.com/?p=823 在C#中有namespace概念,java中有package的概念,有了这些概念之后,在系统的运行时,每一个方法就会拥有唯 ...

pytorch torch.Storage学习

pytorch torch.Storage学习的更多相关文章

随机推荐

热门专题