技术背景

本文所使用的Numpy版本为：Version: 1.20.3。基于Python和C++开发的Numpy一般被认为是Python中最好的Matlab替代品，其中最常见的就是各种Numpy矩阵类型的运算。对于矩阵的运算而言，取对轴和元素是至关重要的，这里我们来看看一些常见的Numpy下标取法和标记。

二维矩阵的取法

这里我们定义一个4*4的矩阵用于取下标，为了方便理解，这个矩阵中所有的元素都是不一样的：

In [1]: import numpy as np

In [2]: x = np.arange(16).reshape((4,4))

In [3]: x

Out[3]:

array([[ 0,  1,  2,  3],

       [ 4,  5,  6,  7],

       [ 8,  9, 10, 11],

       [12, 13, 14, 15]])

取单行和单个元素

比如我们想取第一行的所有元素，那么就是x[0]，如果想取第一行的第一列的元素，那么就是x[0][0]，而在numpy中为了简化，可以讲x[0][0]写成x[0,0]的形式：

In [4]: id = 0

In [5]: x[id]

Out[5]: array([0, 1, 2, 3])

In [6]: x[id][id]

Out[6]: 0

In [7]: x[id,id]

Out[7]: 0

下标的list和tuple格式区分

在上一个章节中我们提到的取单个元素x[0,0]的方法，其实本质上等同于x[(0,0)]，也就是一个tuple的格式，但是如果把这里的tuple格式换成list，所表示的含义和得到的结果是完全不一样的：

In [8]: id = [1,1]

In [9]: x[id]

Out[9]:

array([[4, 5, 6, 7],

       [4, 5, 6, 7]])

In [10]: x[id,id]

Out[10]: array([5, 5])

In [11]: id = (1,1)

In [12]: x[id]

Out[12]: 5

这里list格式的id，代表的意思是分别取第二行和第二行的内容，再放到一个完整的矩阵中。如果id设置为[1,2]的话，就是分别取第二行和第三行，而不是取第二行的第二个元素。如果需要取第二行的第二列的元素，那么还是需要用tuple的格式来取下标。有一个比较有意思的点是，如果把刚才的下标重复输入两次，也就是x[[1,2],[1,2]]的话，所表示的含义是分别取x[1][1]和x[2][2]，再放到同一个矩阵中，也是一种比较常用的分离式取下标的方法。

冒号的使用

在Numpy的下标中，冒号和后置逗号同时出现，表示轴向全取，比如x[0,:]表示取x的第一行的所有数据，x[:,0]表示取第一列的所有数据：

In [14]: id = 1

In [15]: x[id,:]

Out[15]: array([4, 5, 6, 7])

In [16]: x[:,id]

Out[16]: array([ 1,  5,  9, 13])

现存的list与numpy.array不相兼容的取法

虽然上文我们提到，如果下标被定义成一个list格式的话，就表示分别取。但是目前Numpy的实现中还有这样的一个遗留问题，就是使用多维的list格式取下标，会自动将最外层转化成tuple的格式，采用tuple的取法。虽然计算时会给出告警，但是目前来说也需要引起一定的注意。

In [17]: id = [[1],[1]]

In [18]: x[id]

<ipython-input-18-23f8764f4b7e>:1: FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`. In the future this will be interpreted as an array index, `arr[np.array(seq)]`, which will result either in an error or a different result.

  x[id]

Out[18]: array([5])

In [19]: id = np.array([[1],[1]])

In [20]: x[id]

Out[20]:

array([[[4, 5, 6, 7]],

       [[4, 5, 6, 7]]])

两个冒号的组合用法

在Numpy中冒号不与后置逗号同时出现时，表示的含义是从冒号前的元素取值到冒号后的元素，比如x[0:3]所表示的元素是[x[0],x[1],x[2]]。如果是两个冒号连用中间没有逗号的话，比如x[0:3:2]，表示的是每隔2个元素取一个，最后得到的应该是[x[0],x[2]]。还有一种非常常见的操作是取[::-1]这样的下标，所表示的含义就是对当前轴进行倒序。

In [31]: x[::-1]

Out[31]:

array([[12, 13, 14, 15],

       [ 8,  9, 10, 11],

       [ 4,  5,  6,  7],

       [ 0,  1,  2,  3]])

In [32]: x[::-1,::-1]

Out[32]:

array([[15, 14, 13, 12],

       [11, 10,  9,  8],

       [ 7,  6,  5,  4],

       [ 3,  2,  1,  0]])

用None作扩维

虽然在Numpy中有broadcast和expand_dim之类的函数可以对矩阵进行扩维或者是广播，但是更方便的操作是对需要扩展的维度取一个None的下标，比如要把一个(4,4)大小的矩阵扩展成(1,4,4)，那么就对下标取[None,:]或者[None,:,:]即可。而如果需要把(4,4)变成(4,1,4)，那就需要把None换个位置为[:,None,:]就可以实现：

In [33]: x[None,:]

Out[33]:

array([[[ 0,  1,  2,  3],

        [ 4,  5,  6,  7],

        [ 8,  9, 10, 11],

        [12, 13, 14, 15]]])

In [34]: x[:,None,:]

Out[34]:

array([[[ 0,  1,  2,  3]],

       [[ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11]],

       [[12, 13, 14, 15]]])

In [35]: x[:,:,None]

Out[35]:

array([[[ 0],

        [ 1],

        [ 2],

        [ 3]],

       [[ 4],

        [ 5],

        [ 6],

        [ 7]],

       [[ 8],

        [ 9],

        [10],

        [11]],

       [[12],

        [13],

        [14],

        [15]]])

高维矩阵的取法

在高维矩阵中，因为没有了行和列这样的概念，因此需要从轴上去理解相关操作，我们先定义一个简单的三维张量：

In [49]: y = np.arange(32).reshape((2,4,4))

In [50]: y

Out[50]:

array([[[ 0,  1,  2,  3],

        [ 4,  5,  6,  7],

        [ 8,  9, 10, 11],

        [12, 13, 14, 15]],

       [[16, 17, 18, 19],

        [20, 21, 22, 23],

        [24, 25, 26, 27],

        [28, 29, 30, 31]]])

常规的操作其实都跟前面章节中介绍二维张量一致，这里我们考虑一种比较特殊的场景。就是如果同样用二维矩阵的取法去取，只是第一条轴每个元素取一个id，比如取第0条轴的[0,1]元素和第1条轴的[2,3]元素，那么其实最简单的方案就是在第一个下标的位置加上一个位置元素，这个位置元素用下标id的第一个轴的长度去定义即可：

In [58]: id = np.array([[0,1],[2,3]])

In [59]: y[np.arange(id.shape[0]),id[:,0],id[:,1]]

Out[59]: array([ 1, 27])

总结概要

这篇文章的主要内容是梳理在Numpy中经常用到的各种取下标的操作，包括但不限于取指定轴的所有元素、取指定位置的单个元素、取指定位置的多个元素、扩维以及取未显式给定位置的多个元素等等。比较重要的是在Numpy中tuple的取法和list的取法是代表不一样的含义，并且由于历史原因，Numpy中存在一些list取法和numpy.array的取法表示不一致的地方，在本文中进行了总结。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/numpy-id.html

作者ID：DechinPhy

更多原著文章请参考：https://www.cnblogs.com/dechinphy/

打赏专用链接：https://www.cnblogs.com/dechinphy/gallery/image/379634.html

腾讯云专栏同步：https://cloud.tencent.com/developer/column/91958

Numpy的各种下标操作的更多相关文章

C++中下标操作注意事项
C++中,下标操作不添加元素,对于任何使用下标操作的情况,如string类型.vector类型等等,必须是已存在的元素才能用下标操作符进行索引.如果类型为空,通过下标操作进行赋值时,不会添加任何元素 ...
vector 与map的下标操作
1.vector的下标操作不会添加元素,只能针对已经存在的元素操作. 2.map的下标操作具有副作用,key不存在,会在map中添加一个具有该key的新元素,新元素的value使用默认构造方法. 3. ...
Python 列表下标操作
Python 列表下标操作引用网址: https://www.jianshu.com/p/a98e935e4d46
map两种插入方法解析（insert() 与下标[]操作）
insert 含义是: 如果key存在,则插入失败,如果key不存在,就创建这个key-value. 实例: map.insert((key, value)) 利用下标操作的含义是: 如果这个key存 ...
vector 下标操作
比如:vector<int> ivec(3).. 当采用下标操作ivec[10]的时候,该操作是未定义的,在自己的机器上输出的值是零．建议使用迭代器进行操作．
numpy 数组集合运算及下标操作
1. 数组的集合运算 1.1. 并集 np.union1d(a,b)计算数组的并集: In [1]: import numpy as np In [2]: a = np.array([1,2,3]) ...
Numpy 数组的切片操作
实例+解释如下(表格):关键是要明白python中数组的下标体系.一套从左往右,一套从右往左. 1 import numpy as np 2 import sys 3 4 def main(): 5 ...
Numpy入门 - 数组切片操作
本节主要演示数组的切片操作,数组的切片操作有两种形式:更改原数组的切片操作和不更改原数组的切片操作. 一.更改原数组的切片操作 import numpy as np arr = np.array([1 ...
Numpy数组对象的操作-索引机制、切片和迭代方法
前几篇博文我写了数组创建和数据运算,现在我们就来看一下数组对象的操作方法.使用索引和切片的方法选择元素,还有如何数组的迭代方法. 一.索引机制 1.一维数组 In [1]: a = np.arange ...

随机推荐

《剑指offer》面试题19. 正则表达式匹配
问题描述请实现一个函数用来匹配包含'. '和'*'的正则表达式.模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(含0次).在本题中,匹配是指字符串的所有字符匹配整个模式. ...
源代码管理git地址从http改为https，提交400错误
推送400错误 cmd 执行 git config --global http.sslVerify false 推送地址,修改http 为 https 就可以正常提交了
【小记录】解决链接libcufft_static.a库出现的错误
程序中使用了 cv::cuda::dft() 函数,需要在链接的时候使用libcufft_static.a这个库.链接出现大量类似错误:error: undefined reference to __ ...
611. Valid Triangle Number
Given an array consists of non-negative integers, your task is to count the number of triplets chose ...
Tomcat服务器和Servlet版本的对应关系
Tomcat服务器和Servlet版本的对应关系 Servlet 程序从2.5版本是现在世面使用最多的版本(xml配置) 到了Servlet3.0后.就是注解版本的Servlet使用
vscode自定义代码片段，自定义注释片段（动态时间）
下载vscode 一.打开vscode,点击左下角设置图标. 二.点击用户代码片段三.点击新建全局代码片段文件四.输入自定义代码片段配置文件名,例如:vue.json 五.进行代码片段配置示例如下 ...
(3)puppet清单定义资源的语法
1.先看两个例子: a.创建一个文件 file{"/tmp/12567.txt": content => aaaaababbau, ensure => present ...
K8S访问机制
pod -> endpoint -> service -> namespace -> svc.cluster.local .....在 a 名称空间,访问 b 名称空间的 b1 ...
MySQL 5.7主从搭建（同一台机器）
主从复制原理:复制是 MySQL 的一项功能,允许服务器将更改从一个实例复制到另一个实例. 1)主服务器将所有数据和结构更改记录到二进制日志中. 2)从属服务器从主服务器请求该二进制日志并在本地应用其 ...
ICLR2021对比学习（Contrastive Learning）NLP领域论文进展梳理
本文首发于微信公众号「对白的算法屋」,来一起学AI叭大家好,卷王们and懂王们好,我是对白. 本次我挑选了ICLR2021中NLP领域下的六篇文章进行解读,包含了文本生成.自然语言理解.预训练语言模 ...

Numpy的各种下标操作