Numpy 有一个强大之处在于可以很方便的修改生成的N维数组的形状。

更改数组形状

数组具有由沿着每个轴的元素数量给出的形状:

a = np.floor(10*np.random.random((3,4)))
a
Out[181]:
array([[6., 0., 2., 1.],
[5., 2., 8., 2.],
[8., 4., 8., 4.]])
a.shape
Out[182]: (3, 4)

上面生成了一个 3x4 的数组,现在对它进行形状的改变。

a.ravel()
Out[184]: array([6., 0., 2., 1., 5., 2., 8., 2., 8., 4., 8., 4.])
a.reshape(2,6)
Out[185]:
array([[6., 0., 2., 1., 5., 2.],
[8., 2., 8., 4., 8., 4.]])
a.T
Out[186]:
array([[6., 5., 8.],
[0., 2., 4.],
[2., 8., 8.],
[1., 2., 4.]])
a.shape
Out[187]: (3, 4)

无论是ravelreshapeT,它们都不会更改原有的数组形状,都是返回一个新的数组。

使用 resize 方法可以直接修改数组本身:

a
Out[188]:
array([[6., 0., 2., 1.],
[5., 2., 8., 2.],
[8., 4., 8., 4.]])
a.resize(2,6)
a
Out[190]:
array([[6., 0., 2., 1., 5., 2.],
[8., 2., 8., 4., 8., 4.]])

  技巧:在使用 reshape 时,可以将其中的一个维度指定为 -1,Numpy 会自动计算出它的真实值

a.reshape(3, -1)
Out[191]:
array([[6., 0., 2., 1.],
[5., 2., 8., 2.],
[8., 4., 8., 4.]])

  将不同数组堆叠在一起

除了可以对单个数组的形状进行转换外,还可以把多个数据进行堆叠。

a = np.floor(10*np.random.random((2,2)))
a
Out[192]:
array([[0., 3.],
[1., 9.]])
b = np.floor(10*np.random.random((2,2)))
b
Out[193]:
array([[2., 8.],
[9., 7.]])
np.hstack((a,b))
Out[194]:
array([[0., 3., 2., 8.],
[1., 9., 9., 7.]])

 对于2D数组来说,使用hstackcolumn_stack 效果一样,对于1D数组来说,column_stack 会将1D数组作为列堆叠到2D数组中:

from numpy import newaxis
np.column_stack((a,b))
Out[195]:
array([[0., 3., 2., 8.],
[1., 9., 9., 7.]])
a = np.array([4.,2.])
b = np.array([3.,8.])
np.column_stack((a,b))
Out[196]:
array([[4., 3.],
[2., 8.]])
np.hstack((a,b)) # 一维数组的情况下,column_stack和hstack结果不一样
Out[197]: array([4., 2., 3., 8.])
a[:,newaxis]
Out[198]:
array([[4.],
[2.]])
np.column_stack((a[:,newaxis],b[:,newaxis]))
Out[199]:
array([[4., 3.],
[2., 8.]])
np.hstack((a[:,newaxis],b[:,newaxis])) # 二维数组的情况下,column_stack和hstack结果一样
Out[200]:
array([[4., 3.],
[2., 8.]])

 另一方面,对于任何输入数组,函数row_stack等效于vstack。一般来说,对于具有两个以上维度的数组,hstack沿第二轴堆叠,vstack沿第一轴堆叠,concatenate允许一个可选参数,给出串接应该发生的轴。

将一个数组分成几个较小的数组

既然可以将多个数组进行对堆叠,自然也可以将一个数组拆分成多个小数组。

使用hsplit,可以沿其水平轴拆分数组,通过指定要返回的均匀划分的数组数量,或通过指定要在其后进行划分的列:

from pprint import pprint
a = np.floor(10*np.random.random((2,12)))
a
Out[201]:
array([[8., 5., 5., 7., 3., 5., 8., 6., 2., 8., 9., 0.],
[5., 8., 0., 0., 9., 0., 7., 5., 3., 9., 4., 8.]])
pprint(np.hsplit(a,3)) #水平切成三等分
[array([[8., 5., 5., 7.],
[5., 8., 0., 0.]]),
array([[3., 5., 8., 6.],
[9., 0., 7., 5.]]),
array([[2., 8., 9., 0.],
[3., 9., 4., 8.]])]

vsplit沿垂直轴分割,array_split允许指定沿哪个轴分割。

Numpy系列(六)- 形状操作的更多相关文章

  1. 3.6Python数据处理篇之Numpy系列(六)---Numpy随机函数

    目录 目录 前言 (一)基础的随机函数 (二)轴的随机函数 (三)概率的随机函数 目录 前言 前一段日子学了numpy,觉得无趣,没有学完,不过后来看了看matplotlib,sympy等库时,频频用 ...

  2. Linux学习系列八:操作网口

    一些相对高性能的单片机会带以太网接口,网口在MCU里算是比较复杂的外设了,因为它涉及到网络协议栈,通常情况下网络协议栈会运行在一个RTOS中,所以对普通单片机开发者来说网口使用起来相对难度较大一些.在 ...

  3. 【C++自我精讲】基础系列六 PIMPL模式

    [C++自我精讲]基础系列六 PIMPL模式 0 前言 很实用的一种基础模式. 1 PIMPL解释 PIMPL(Private Implementation 或 Pointer to Implemen ...

  4. Netty4.x中文教程系列(六) 从头开始Bootstrap

    Netty4.x中文教程系列(六) 从头开始Bootstrap 其实自从中文教程系列(五)一直不知道自己到底想些什么.加上忙着工作上出现了一些问题.本来想就这么放弃维护了.没想到有朋友和我说百度搜索推 ...

  5. struts2官方 中文教程 系列六:表单验证

    先贴个本帖的地址,以免被爬:struts2教程 官方系列六:表单验证  即 http://www.cnblogs.com/linghaoxinpian/p/6906720.html 下载本章节代码 介 ...

  6. Bing Maps进阶系列六:使用Silverlight剪切(Clip)特性实现Bing Maps的迷你小地图

    Bing Maps进阶系列六:使用Silverlight剪切(Clip)特性实现Bing Maps的迷你小地图 Bing Maps Silverlight Control虽然为我们提供了简洁.方面的开 ...

  7. 学习ASP.NET Core Blazor编程系列六——新增图书(上)

    学习ASP.NET Core Blazor编程系列一--综述 学习ASP.NET Core Blazor编程系列二--第一个Blazor应用程序(上) 学习ASP.NET Core Blazor编程系 ...

  8. CSS 魔法系列:纯 CSS 绘制各种图形《系列六》

    我们的网页因为 CSS 而呈现千变万化的风格.这一看似简单的样式语言在使用中非常灵活,只要你发挥创意就能实现很多比人想象不到的效果.特别是随着 CSS3 的广泛使用,更多新奇的 CSS 作品涌现出来. ...

  9. Java基础复习笔记系列 七 IO操作

    Java基础复习笔记系列之 IO操作 我们说的出入,都是站在程序的角度来说的.FileInputStream是读入数据.?????? 1.流是什么东西? 这章的理解的关键是:形象思维.一个管道插入了一 ...

  10. Matlab命令系列之目录操作

    Matlab命令系列之目录操作 filesep 用于返回当前平台的目录分隔符,Windows是反斜杠(),Linux是斜杠(/).有时此命令结合ispc命令使用,可以灵活的设置目录分割符. fullf ...

随机推荐

  1. python粗谈面向对象(一)

    1.面向过程编程vs函数式编程 面向过程编程 以计算对象的元素个数为例. str_1 = 'abcdefg' count = 0 for i in str_1: # 统计字符串元素个数 count + ...

  2. 进程命令(tasklist)

    TaskList命令: // 描述: 显示本地或远程计算机上正在运行的进程列表信息. // 语法: tasklist [/s <computer> [ /u [<domain> ...

  3. SQLServer之数据类型解析

    数字 int.bigint.smallint 和 tinyint 使用整数数据的精确数字数据类型. 数据类型 范围 存储 tinyint 0 到 255. 1 字节 smallint -2^15 (- ...

  4. SAP CRM Installed Bases(IBase)简介

    SAP CRM使用Installed Base(以下简称IBase)来组织服务相关对象并进行管理.因为我在最近的工作中经常接触这个概念,所以学习了一点相关文档.下面是文档的翻译. 本文链接:https ...

  5. git如何设置ssh密钥

    git设置ssh密钥 目前git支持https和git两种传输协议,github分享链接时会有两种协议可选: 1.Clone with SSH 2.Clone with HTTPS git在使用htt ...

  6. 给Integer对象加锁的错误方式

    package com.thread.test; public class BadLockOnInteger implements Runnable { public static Integer i ...

  7. 【Python 25】52周存钱挑战5.0(datetime库和import)

    1.案例描述 按照52周存钱法,存钱人必须在一年52周内,每周递存10元.例如,第一周存10元,第二周存20元,第三周存30元,直到第52周存520元. 记录52周后能存多少钱?即10+20+30+. ...

  8. SpringBoot四大核心

    auto-configuration.starters.cli.actuator

  9. wxWidgets 和 QT 之间的选择

    (非原创,网络摘抄) 跨平台的C++ GUI工具库很多,可是应用广泛的也就那么几个,Qt.wxWidgets便是其中的翘楚这里把GTK+排除在外,以C实现面向对象,上手相当困难,而且Windows平台 ...

  10. AI GMM

    GMM(Gaussian Mixture Model,高斯混合模型)通常用于聚类(也用于密度估计),数据是由k个高斯分布生成,每个分布表示一个类. 期望最大(Expectation Maximizat ...