欢迎关注公众号【Python开发实战】, 获取更多内容!

工具-numpy

numpy是使用Python进行数据科学的基础库。numpy以一个强大的N维数组对象为中心,它还包含有用的线性代数,傅里叶变换和随机数函数。

ndarray的迭代

导入numpy

import numpy as np

在ndarray的迭代与常规Python数组的迭代非常相似。但是需要住的是,多维ndarray的迭代是相对于第一个轴完成的。

c = np.arange(24).reshape(2, 3, 4)
c

输出:

array([[[ 0,  1,  2,  3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]], [[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23]]])
for m in c:
print('item:')
print(m)

输出:

item:
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
item:
[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]
for i in range(len(c)):  # 这里,len(c)等于c.shape[0]
print('item')
print(c[i])

输出:

item
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
item
[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]

如果想要迭代ndarray中的所有元素,需要对ndarray的flat属性进行迭代。

for i in c.flat:
print('item: ', i)

输出:

item:  0
item: 1
item: 2
item: 3
item: 4
item: 5
item: 6
item: 7
item: 8
item: 9
item: 10
item: 11
item: 12
item: 13
item: 14
item: 15
item: 16
item: 17
item: 18
item: 19
item: 20
item: 21
item: 22
item: 23

堆叠ndarray

将不同的ndarray堆叠在一起通常很有用。numpy提供了几个函数来实现堆叠。介绍堆叠函数之前,先创建几个ndarray。

q1 = np.full((3, 4), 1.0)
q1

输出:

array([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]])
q2 = np.full((4, 4), 2.0)
q2

输出:

array([[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.]])
q3 = np.full((3, 4), 3.0)
q3

输出:

array([[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]])

vstack

vstack可以垂直堆叠ndarray,但是要满足需要堆叠的ndarray,除了垂直轴以外,即在水平轴上要具有相同的形状。

q4 = np.vstack((q1, q2, q3))
q4

输出:

array([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]])
q4.shape

输出:

(10, 4)

hstack

hstack可以水平堆叠ndarray。但是要满足需要堆叠的ndarray在垂直轴上具有相同的形状。

q5 = np.hstack((q1, q3))
q5

输出:

array([[1., 1., 1., 1., 3., 3., 3., 3.],
[1., 1., 1., 1., 3., 3., 3., 3.],
[1., 1., 1., 1., 3., 3., 3., 3.]])
q5.shape

输出:

(3, 8)
try:
q6 = np.hstack((q1, q2, q3))
except ValueError as e:
print(e)

输出:

all the input array dimensions except for the concatenation axis must match exactly

concatenate

concatenate可以沿给定的现有轴进行堆叠, 故vstack相当于调用axis=0的concatenate, hstack相当于调用axis=1的concatenate。

q7 = np.concatenate((q1, q2, q3), axis=0)  # 相当于vstack
q7

输出:

array([[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[2., 2., 2., 2.],
[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]])
q7.shape

输出:

(10, 4)
q8 = np.concatenate((q1, q3), axis=1)   # 相当于hstack
q8

输出:

array([[1., 1., 1., 1., 3., 3., 3., 3.],
[1., 1., 1., 1., 3., 3., 3., 3.],
[1., 1., 1., 1., 3., 3., 3., 3.]])
q8.shape

输出:

(3, 8)

stack

stack是沿着新轴进行堆叠,因此需要堆叠的ndarray必需具有相同的shape.

q9 = np.stack((q1, q3))
q9

输出:

array([[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]], [[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]]])
q9.shape

输出:

(2, 3, 4)
try:
q10 = np.stack((q1, q2))
except ValueError as e:
print(e)

输出:

all input arrays must have the same shape

拆分ndarray

拆分ndarray与堆叠相反。

r = np.arange(24).reshape(6, 4)
r

输出:

array([[ 0,  1,  2,  3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23]])

vsplit

vsplit可以垂直拆分ndarray, 下面的例子是将r垂直分成三等份。

r1, r2, r3 = np.vsplit(r, 3)
r1

输出:

array([[0, 1, 2, 3],
[4, 5, 6, 7]])
r2

输出:

array([[ 8,  9, 10, 11],
[12, 13, 14, 15]])
r3

输出:

array([[16, 17, 18, 19],
[20, 21, 22, 23]])

hsplit

hsplit可以水平拆分ndarray。

r4, r5 = np.hsplit(r, 2)
r4

输出:

array([[ 0,  1],
[ 4, 5],
[ 8, 9],
[12, 13],
[16, 17],
[20, 21]])
r5

输出:

array([[ 2,  3],
[ 6, 7],
[10, 11],
[14, 15],
[18, 19],
[22, 23]])

split

split可以沿给定的现有轴进行拆分,调用axis=0的split相当于调用vsplit,调用axis=1的split相当于调用hsplit。

r6, r7 = np.split(r, 2, axis=1)
r6

输出:

array([[ 0,  1],
[ 4, 5],
[ 8, 9],
[12, 13],
[16, 17],
[20, 21]])

转置ndarray

transpose函数是在ndarray的数据上创建一个新的视图,并按照给定顺序对轴排列。

t = np.arange(24).reshape(4, 2, 3)
t

输出:

array([[[ 0,  1,  2],
[ 3, 4, 5]], [[ 6, 7, 8],
[ 9, 10, 11]], [[12, 13, 14],
[15, 16, 17]], [[18, 19, 20],
[21, 22, 23]]])

现在创建一个ndarray,将轴0、1、2(深度、高度、宽度)重新排列为1、2、0(高度、宽度、深度)。

t1 = t.transpose((1, 2, 0))
t1

输出:

array([[[ 0,  6, 12, 18],
[ 1, 7, 13, 19],
[ 2, 8, 14, 20]], [[ 3, 9, 15, 21],
[ 4, 10, 16, 22],
[ 5, 11, 17, 23]]])
t1.shape

输出:

(2, 3, 4)

默认情况下,transpose会翻转轴的顺序。

t2 = t.transpose()   # 相当于t.transpose((2, 1, 0))
t2

输出:

array([[[ 0,  6, 12, 18],
[ 3, 9, 15, 21]], [[ 1, 7, 13, 19],
[ 4, 10, 16, 22]], [[ 2, 8, 14, 20],
[ 5, 11, 17, 23]]])
t2.shape

输出:

(3, 2, 4)

numpy提供了一个方便的swapaxes来交换两个轴, 例如,创建一个深度和高度交换的ndarray。

t3 = t.swapaxes(0, 1)
t3

输出:

array([[[ 0,  1,  2],
[ 6, 7, 8],
[12, 13, 14],
[18, 19, 20]], [[ 3, 4, 5],
[ 9, 10, 11],
[15, 16, 17],
[21, 22, 23]]])
t3.shape

输出:

(2, 4, 3)

numpy教程05---ndarray的高级操作的更多相关文章

  1. 数据分析05 /pandas的高级操作

    数据分析05 /pandas的高级操作 目录 数据分析05 /pandas的高级操作 1. 替换操作 2. 映射操作 3. 运算工具 4. 映射索引 / 更改之前索引 5. 排序实现的随机抽样/打乱表 ...

  2. W3School Redis教程(安装/基本操作/高级操作/命令/官方文档/官方集群教程)

    说明:Redis有自身的客户端连接软件,也可以使用Telnet进行连接操作. 来自W3School的Redis教程,基本上涵盖了从安装到状态监控的教程. W3School:https://www.gi ...

  3. W3School Memcached教程(安装/基本操作/高级操作/命令)

    来自W3School的Memcached教程,基本上涵盖了从安装到状态监控的教程. 不过最全的应该是官方提供在GitHub上的Wiki教程,一切的标准都来自官方,参考:https://github.c ...

  4. Numpy ndarray 的高级索引存在 "bug" ?

    Numpy ndarray 高级索引 "bug" ? 话说一天,搞事情,代码如下 import numpy as np tmp = [1, 2, 3, 4] * 2 a, b = ...

  5. MDN 文档高级操作进阶教程

    MDN 文档高级操作进阶教程 MDN 文档, 如何优雅的使用 MDN 文档上的富文本编辑器 pre & 语法高亮器 code & note box source code 上传附件 i ...

  6. numpy教程

    [转]CS231n课程笔记翻译:Python Numpy教程 原文链接:https://zhuanlan.zhihu.com/p/20878530 译者注:本文智能单元首发,翻译自斯坦福CS231n课 ...

  7. 转:Numpy教程

    因为用到theano写函数的时候饱受数据结构困扰 于是上网找了一篇numpy教程(theano的数据类型是基于numpy的) 原文排版更好,阅读体验更佳: http://phddreamer.blog ...

  8. Python 机器学习库 NumPy 教程

    0 Numpy简单介绍 Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy.matplotlib一起使用.其实,list已经提供了类似于矩阵的表示形式,不过numpy ...

  9. pandas高级操作

    pandas高级操作 import numpy as np import pandas as pd from pandas import DataFrame,Series 替换操作 替换操作可以同步作 ...

  10. 【MongoDB详细使用教程】四、python操作MongoDB

    目录 1.安装pymongo 2.连接数据库 3.操作数据库 3.1.查 3.2.增 3.3.改 3.4.删 使用第三方库pymongo来实现python对MongoDB的操作 pymongo官方文档 ...

随机推荐

  1. 把EI科技 【载谈 Binomial Sum】 用人话说出来

    这个科技是用来 \(O(k+\log n)\) 求 \(\sum_{i=0}^n [x^i] f(x)p^i(x) \mod x^{k+1}\) 这个多项式的某些项数的线性组合 不过我只见过求第 $ ...

  2. java 网络编程之Socket编程

      1.客户端代码 1 package com.gylhaut.socket; 2 3 import java.io.BufferedReader; 4 import java.io.IOExcept ...

  3. jdbc action 接口示例

    package com.gylhaut.action; import java.sql.SQLException;import java.util.ArrayList;import java.util ...

  4. Java数组经典例题

    数组中元素的求和 public class T02 { public static void main(String[] args) { int[][]arr=new int[][]{{1,2,3,4 ...

  5. Floyd算法 解决多元汇最短路问题

    接下来是图论问题求解最短路问题的最后一个,求解多元汇最短路问题 我们之前一般都是问1-n的最短路径,这里我们要能随便去问i到j的最短路径: 这里介绍一下Floyd算法:我们只有一个d[maxn][ma ...

  6. Android 12(S) 图形显示系统 - BufferQueue的工作流程(十一)

    题外话 我竟然已经写了这个系列的十一篇文章了,虽然内容很浅显,虽然内容很枯燥,虽然内容也许没营养,但我为自己的坚持点赞! 一.前言 前面的两篇文章,分别讲解了Producer的处理逻辑和queue b ...

  7. Spring Boot整合Redis-转载

    Spring Boot整合Redis的三中方式的博客: https://wangsong.blog.csdn.net/article/details/103210490 使用spring.cache. ...

  8. count(*)这么慢,我该怎么办?

    1)计算一个表有多少行数用什么命令? select count(*) from t 2)count(*)底层是怎样实现的? 在MYISAM中,是把这个总行数存到磁盘中去的,要的时候直接去读就行,特别快 ...

  9. Hadoop2.x与Hadoop3.x副本选择机制

    HDFS 上的文件对应的 Block 保存多个副本,且提供容错机制,副本丢失或者宕机自动恢复,默认是存 3 个副本. 2.8.x之前的副本策略 官方文档说明: https://hadoop.apach ...

  10. Java9的模块化是什么

    Java9新特性中的模块化到底是什么 Java9中的一个重大特性是增加了一种新型的程序设计组件 - 模块. 官方对模块的定义为:一个被命名的,代码和数据的自描述集合.( the module, whi ...