tensor数据基操----索引与切片

玩过深度学习图像处理的都知道，对于一张分辨率超大的图片，我们往往不会采取直接压平读入的方式喂入神经网络，而是将它切成一小块一小块的去读，这样的好处就是可以加快读取速度并且减少内存的占用。就拿医学图像处理来说吧，医学CT图像一般都是比较大的，一张图片就可能达到500MB+，有的甚至超过1GB，下面是切过的一张已经被各种压缩过的肝脏CT图像的一角。

我们可以看到它的像素仍有5210*4200之多，如果直接把这样一张图片压平，将会得到一个5210*4200=21882000维的tensor，将这样一个上千万维的数据直接喂入神经网络，我不知道性能特别特别好的电脑能不能撑起来，反正我的电脑是肯定崩溃。那么如何处理这样图片呢？回到我们的标题----索引和切片。通过切片的方式我们可以把这张图片分成若干28*28（或者其他合适分辨率）的小图，分批次将这张图喂入神经网络，可想而知会取得不错的效果。接下来就记录几种索引切片的方式。

方式1：通过连续的[ ]

这种方式在各种编程语言中都很常见，即数组的索引，但是这种方式只能取到某一具体维度的数值，不能随心所欲的固定间隔或者非固定间隔的切片

a = tf.ones([1,5,5,3])

print(a[0][0])

print(a[0][0][0])

print(a[0][0][0][2])

方式2：通过[ , , ,……]

这种方式其实是numpy对方式1的一种在可读性方面的优化，和方式1相比，可读性明显提高

a = tf.random.normal([4,28,28,3])

print(a[1].shape)

print(a[1,2].shape)

print(a[1,2,3].shape)

print(a[1,2,3,2].shape)

方式3：一维tensor可通过[ ：]

这种方式也是python中比较常用的数组切片方式，切片范围[ A:B)

a=tf.range(10)

print(a)

print(a[-1:])

print(a[-2:])

print(a[:2])

print(a[:-1])

方式4：对于多维tensor可通过[ ，：，：，：……]

相对前面几种切片方式都更加丰富，也可以完成多样的切片（跳过某一维度）start：end

a = tf.random.normal([4,28,28,3])

print(a[0,:,:,:].shape)

print(a[0,1,:,:].shape)

print(a[:,:,:,0].shape)

print(a[:,:,:,2].shape)

print(a[:,0,:,:].shape)

方式5：隔行采样[ : : ,: : ,: : ,……]

通过增加了一个：,使用方式start：end：step进行间隔采样（：：step代表从最开始到最末尾以步长step间隔采样）

a = tf.random.normal([4,28,28,3])

print(a[:,0:28:2,0:28:2,:].shape)

print(a[:,:14,:14,:].shape)

print(a[:,14:,14:,:].shape)

print(a[:,::2,::2,:].shape)

注：若step<0则倒序采样

方式6：用…进行采样

...可以代替连续的：,增强代码的易书写性和可读性

a = tf.random.normal([2,4,28,28,3])

print(a[0,:,:,:,:].shape)

print(a[0,...].shape)

print(a[:,:,:,:,0].shape)

print(a[...,0].shape)

print(a[0,...,2].shape)

print(a[1,0,...,0].shape)

方式6：selective indexing

使用tf.gather、tf.gather_nd、tf.boolean_mask进行随机采样

（1）tf.gather（在某一维度指定index）

# 下面的tensor即表示，4个班级，每个班级35名学生，每个学生8门课的成绩

a = tf.random.normal([4,35,8])

# axis表示维度，indices表示在axis维度上要取数据的索引

print(tf.gather(a,axis=0,indices=[2,3]).shape) # 可理解为取第2、3个班级的学生成绩，同a[2:4].shape

print(tf.gather(a,axis=0,indices=[2,1,3,0]).shape) # 可理解为依次取第2、1、3、0个班级的学生成绩

print(tf.gather(a,axis=1,indices=[2,3,7,9,16]).shape) # 可理解为取所有班级第2,3,7,9,16个学生的成绩

print(tf.gather(a,axis=2,indices=[2,3,7]).shape) # 可理解为取所有班级所有学生第2,3,7门课的成绩

（2）tf.gather_nd（在多个维度指定index）

a = tf.random.normal([4,35,8])

# axis表示维度，indices表示在axis维度上要取数据的索引

print(tf.gather_nd(a,[0]).shape) # 可理解为取0号班级的所有成绩

print(tf.gather_nd(a,[0,1]).shape) # 可理解为取0号班级1号学生的成绩

print(tf.gather_nd(a,[0,1,2]).shape) # 可理解为取0号班级1号学生的第2门课成绩

print(tf.gather_nd(a,[[0,0],[1,1]]).shape) # 可理解为取0号班级0号学生和1号班级1号学生的成绩

print(tf.gather_nd(a,[[0,0],[1,1],[2,2]]).shape) # 可理解为取0号班级0号学生、1号班级1号学生、2号班级2号学生的成绩

print(tf.gather_nd(a,[[0,0,0],[1,1,1],[2,2,2]]).shape) # 可理解为0班0学0课，1班1学1课，2班2学2课的成绩

print(tf.gather_nd(a,[[[0,0,0],[1,1,1],[2,2,2]]]).shape) # shape与上不同

（3）tf.boolean_mask（通过True和False的方式选择数据）

a = tf.random.normal([4,28,28,3])

print(tf.boolean_mask(a,mask=[True,True,False,False]).shape)

print(tf.boolean_mask(a,mask=[True,True,False],axis=3).shape)

a = tf.ones([2,3,4])

print(tf.boolean_mask(a,mask=[[True,False,False],[False,True,True]]))

tensor数据基操----索引与切片的更多相关文章

pytorch——不用包模拟简单线性预测，数据类型，创建tensor，索引与切片
常见的学习种类线性回归,最简单的y=wx+b型的,就像是调节音量大小.逻辑回归,是否问题.分类问题,是猫是狗是猪最简单的线性回归y=wx+b 目的:给定大量的(x,y)坐标点,通过机器学习来找出最 ...
编码,基本数据类型,str索引和切片,for循环
1. 编码 1. 最早的计算机编码是ASCII. 美国人创建的. 包含了英文字母(大写字母, 小写字母). 数字, 标点等特殊字符!@#$% 128个码位 2**7 在此基础上加了一位 2**8 8位 ...
numpy之索引和切片
索引和切片一维数组一维数组很简单,基本和列表一致. 它们的区别在于数组切片是原始数组视图(这就意味着,如果做任何修改,原始都会跟着更改). 这也意味着,如果不想更改原始数组,我们需要进行显式的复制 ...
Numpy系列（四）- 索引和切片
Python 中原生的数组就支持使用方括号([])进行索引和切片操作,Numpy 自然不会放过这个强大的特性. 单个元素索引 1-D数组的单元素索引是人们期望的.它的工作原理与其他标准Python序 ...
金融量化分析【day110】：Pandas-DataFrame索引和切片
一.实验文档准备 1.安装 tushare pip install tushare 2.启动ipython C:\Users\Administrator>ipython Python 3.7.0 ...
Numpy学习二：数组的索引与切片
1.一维数组索引与切片#创建一维数组arr1d = np.arange(10)print(arr1d) 结果:[0 1 2 3 4 5 6 7 8 9] #数组的索引从0开始,通过索引获取第三个元素a ...
数据类型&字符串得索引及切片
一:数据类型 1):int 1,2,3用于计算 2):bool ture false 用于判断,也可做为if的条件 3):str 用引号引起来的都是str 存储少量数据,进行 ...
3.3Python数据处理篇之Numpy系列(三)---数组的索引与切片
目录 (一)数组的索引与切片 1.说明: 2.实例: (二)多维数组的索引与切片 1.说明: 2.实例: 目录: 1.一维数组的索引与切片 2.多维数组的索引与切片 (一)数组的索引与切片 1.说明: ...
NumPy学习(索引和切片，合并，分割，copy与deep copy)
NumPy学习(索引和切片,合并,分割,copy与deep copy) 目录索引和切片合并分割 copy与deep copy 索引和切片通过索引和切片可以访问以及修改数组元素的值一维数组程 ...

随机推荐

版本控制工具-svn
两个疑问: 1.什么是版本控制? 2.为什么要用版本控制工具? 银联卡的特征: 1.受保护的 2.受约束的如何与银联卡对应? 1.个人的代码--口袋里的钱 2.版本控制工具中的代码--银联卡里的钱 ...
DOCKER 学习笔记9 Kubernetes (K8s) 弹性伸缩容器下
前言从上一篇看来,我们已经对于Kubernetes ,通过minikube 建立集群,而后使用kubectl 进行交互,对Deployment 部署以及服务的暴露等.这节,将学习弹性的将服务部署到多 ...
小白学 Python 数据分析（6）：Pandas （五）基础操作（2）数据选择
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础小白学 Python 数据分析(2):Pandas (一)概述小白学 Python 数据分析(3):P ...
javascript Math对象常用数字操作方法
var t='1.2'; parseInt(t) parseFloat(t)//1.2 Number(1.2)//1.2强制转换为数字 2.向上取整,有小数就整数部分加1 js: Math.ceil( ...
js+css页面横屏
<!DOCTYPE html> <html lang='zh'> <head> <meta charset="utf-8" /> & ...
GNU C相关
GNU __attribute__ 用于在函数声明时,定义函数参数的一些特殊属性,比如,如果函数的某个参数可能用不到,那么,将该参数增加unused属性即可,如下(一般用两个括号包括属性unused) ...
Element-UI ( Dropdow )下拉菜单组件command传输对象
通过 :command绑定对象数据,handleCommand方法处理数据 template <div v-for="(item, index) in FlyWarningList&q ...
Linux监控-历史细项数据回溯
Linux监控数据回溯网络服务监控应用场景: lvs 后端内网端机器网络波动监控: nginx 80.443端口连接监控: mysql 连接监控以上为抛砖引玉,根据环境安装到监控工具(open ...
linux中vim常用操作
三种模式 # 命令模式 vim 文件名 # 插入模式按a/i/o 进行插入模式按esc 重新进入命令模式 # 编辑模式按:(冒号)进入编辑模式插入命令命令作用 a 在光标所在字符后插入 A ...
[CQOI2015]选数（莫比乌斯反演，杜教筛）
[CQOI2015]选数(luogu) Description 题目描述我们知道,从区间 [L,H](L 和 H 为整数)中选取 N 个整数,总共有 (H-L+1)^N 种方案. 小 z 很好奇这样 ...

tensor数据基操----索引与切片

tensor数据基操----索引与切片的更多相关文章

随机推荐

热门专题