在学习数据分析时,NumPy作为最基础的数据分析库,我们能够熟练的掌握它是学习数据分析的必要条件。接下来就让我们学习该库吧。

学习NumPy库的环境:

python:3.6.6

编辑器:pycharm

NumPy安装:在cmd命令下,直接使用pip语句,pip install NumPy即可!

NumPy是使用Python进行科学计算的基本软件包。它主要包含一下内容:

  • 有一个强大的N维数组对象ndarray;
  • 拥有复杂的广播功能函数;
  • 整合C/C++和Fortran代码的工具;
  • 线性代数、傅里叶变换、随机数生成等功能。

具体的内容可参考NumPy官网信息:点击官网

Python基础数据类型中是没有数组概念,NumPy库能够很好的满足了数组缺失,数组对象的优点有:

  1. 数组对象可以去掉元素间运算的循环,使一维向量更像单个数据;
  2. 设置专门的数组对象,经过优化,可以提升这类应用的运算速度;
  3. 数组对象采用相同的数据类型,有助于节省运算和存储空间。

 一、ndarray的介绍

1、ndarray的构成:

ndarray有两部分构成,一是实际数据;二是描述这些数据的元数据(数据维度、数据类型等)。ndarray数组一般要求所有元素类型相同(同质),数组的下标从0开始。

其中轴(axis):保存数组的维度;秩(rank):轴的数量

2、ndarray对象的属性:

.ndim:秩,即轴的数量或维度的数量;

.shape:ndarray对象的尺度,对于矩阵,n行m列;

.size:ndarray对象元素的个数,相当于.shape的n*m的值;

.dtype:ndarray对象的元素类型;
.itemsize:ndarray对象中每个元素的大小,以字节为单位。

如下举例说明:

求数组a的平方和数组b的立方和:

import numpy as np

def npSum():
a = np.array([0, 1, 2, 3, 4])
b = np.array([9, 8, 7, 6, 5])
c = a ** 2 + b ** 3
return c print(npSum())
[729 513 347 225 141]

如下是ndarray属性的练习:

import numpy as np
a = np.array([[0, 1, 2, 3, 4], [9, 8, 7, 6, 5]])
print(a)
print(a.ndim)
print(type(a))
print(a.shape)
print(a.size)
print(a.dtype)
print(a.itemsize) [[0 1 2 3 4]
[9 8 7 6 5]]
2
<class 'numpy.ndarray'>
(2, 5)
10
int32
4

3、ndarray数组的创建方法:

  • 从python中的列表、元组等类型创建ndarray;
  • 使用NumPy中函数创建ndarray数组,如arange,ones,zeros;
  • 从字节流(raw bytes)中创建ndarray数组;
  • 从文件中读取特定的格式创建ndarray数组。

如下举例说明:

①、从python中的列表、元组等类型创建ndarray数组:

 import numpy as np
x = np.array([[1, 2], [9, 8], (0.1, 0.2)])
print(x)
print(x.shape)
print(x.size) [[1. 2. ]
[9. 8. ]
[0.1 0.2]]
(3, 2)
6

②、使用NumPy中函数创建ndarray数组:

np.arange(n)            类似range()函数,返回ndarray类型,元素从0到n-1;
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型;
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型;
np.full(shape, val) 根据shape生成一个数组,每个元素值都是val;
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0;
类似函数
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组

 import numpy as np

 print(np.arange(10))
print(np.ones((3, 6)))
print(np.zeros((3, 6), dtype=np.int32))
print(np.eye(5)) [0 1 2 3 4 5 6 7 8 9]
[[1. 1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1. 1.]]
[[0 0 0 0 0 0]
[0 0 0 0 0 0]
[0 0 0 0 0 0]]
[[1. 0. 0. 0. 0.]
[0. 1. 0. 0. 0.]
[0. 0. 1. 0. 0.]
[0. 0. 0. 1. 0.]
[0. 0. 0. 0. 1.]]

 #不限制数据类型的时候生成的是浮点数
a = np.linspace(1, 10, 4)
print(a)
# endpoint 是指最后一个元素是否是生成的四个元素中的一个
b = np.linspace(1, 10, 4, endpoint=False)
print(b)
c = np.concatenate((a, b))
print(c) [ 1. 4. 7. 10.]
[1. 3.25 5.5 7.75]
[ 1. 4. 7. 10. 1. 3.25 5.5 7.75]

4、数组的变换

对于创建后的ndarray数组,可以对其进行维度变换和元素类型变换:

ndarray数组的维度变换
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1, ax2) 将数组n个维度中的两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变
 a = np.ones((2, 3, 4), dtype=np.int32)
print(a)
print(a.reshape((3, 8)))
print(a.resize((3, 8)))
print(a)
print(a.flatten()) [[[1 1 1 1]
[1 1 1 1]
[1 1 1 1]] [[1 1 1 1]
[1 1 1 1]
[1 1 1 1]]]
[[1 1 1 1 1 1 1 1]
[1 1 1 1 1 1 1 1]
[1 1 1 1 1 1 1 1]]
None
[[1 1 1 1 1 1 1 1]
[1 1 1 1 1 1 1 1]
[1 1 1 1 1 1 1 1]]
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]

# astype()方法一定会创建新的数组(原始数组的一个拷贝),即使两个类型一致

 a = np.ones((2, 3, 4),  dtype=np.int)
print(a)
b = a.astype(np.float)
print(b) [[[1 1 1 1]
[1 1 1 1]
[1 1 1 1]] [[1 1 1 1]
[1 1 1 1]
[1 1 1 1]]]
[[[1. 1. 1. 1.]
[1. 1. 1. 1.]
[1. 1. 1. 1.]] [[1. 1. 1. 1.]
[1. 1. 1. 1.]
[1. 1. 1. 1.]]]

5、ndarray数组向列表的转换

 import numpy as np

 a = np.full((2, 3, 4), 25, dtype=np.int32)
print(a)
print(a.tolist()) [[[25 25 25 25]
[25 25 25 25]
[25 25 25 25]] [[25 25 25 25]
[25 25 25 25]
[25 25 25 25]]]
[[[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]], [[25, 25, 25, 25], [25, 25, 25, 25], [25, 25, 25, 25]]]

(一)初识NumPy库(数组的创建和变换)的更多相关文章

  1. (二)初识NumPy库(数组的操作和运算)

    本章主要介绍的是ndarray数组的操作和运算! 一. ndarray数组的操作: 操作是指对数组的索引和切片.索引是指获取数组中特定位置元素的过程:切片是指获取数组中元素子集的过程. 1.一维数组的 ...

  2. 初识NumPy库-基本操作

    ndarray(N-dimensional array)对象是整个numpy库的基础. 它有以下特点: 同质:数组元素的类型和大小相同 定量:数组元素数量是确定的 一.创建简单的数组: np.arra ...

  3. 初识numpy库

    numpy是一个在Python中做科学计算的基础库,重在数值计算,也是大部分Python科学计算库的基础库,多用于在大型.多维数组上执行数值运算 numpy创建数组(矩阵): numpy中的数据类型: ...

  4. 初识Java——一维数组的创建及使用

    数组作为对象是允许使用new关键字进行内存分配的,在使用数组前,必须首先定义数组的变量所属的类型.一维数组的创建有两种方法: 1,先声明,再用new运算符进行内存分配 数组元素类型+数组名字[] 数组 ...

  5. $python数据分析基础——初识numpy库

    numpy库是python的一个著名的科学计算库,本文是一个quickstart. 引入:计算BMI BMI = 体重(kg)/身高(m)^2 假如有如下几组体重和身高数据,让求每组数据的BMI值: ...

  6. 3.2Python数据处理篇之Numpy系列(二)--- ndarray数组的创建与变换

    目录 (一)ndarray数组的创建 1.从列表以元组中创建: 2.使用函数创建: (二)ndarray数组的变换 1.维度的变换: 2.类型的变换: 目录: 1.ndarray数组的创建 2.nda ...

  7. ndarray 数组的创建和变换

    ndarray数组的创建方法 1.从python中的列表,元组等类型创建ndarray数组 x = np.array(list/tuple) x = np.array(list/tuple,dtype ...

  8. Python 学习笔记之 Numpy 库——数组基础

    1. 初识数组 import numpy as np a = np.arange(15) a = a.reshape(3, 5) print(a.ndim, a.shape, a.dtype, a.s ...

  9. numpy库数组拼接np.concatenate的用法

    concatenate功能:数组拼接 函数定义:numpy.concatenate((a1, a2, ...), axis=0, out=None)

随机推荐

  1. 使用IDEA2017.3.5搭建SSM框架

    转载自博客园,附上原文地址https://www.cnblogs.com/hackyo/p/6646051.html?utm_source=itdadao&utm_medium=referra ...

  2. 洛谷 题解 P1684 考验

    本蒟蒻又来发题解啦! 这个题的正解应该是贪心 直接找题目的关键: 韵脚只可能是 "AABB", "ABAB", "ABBA" 和" ...

  3. Sring+mybatis模拟银行转账

    实体类: package com.bjsxt.pojo; import java.io.Serializable; public class Account implements Serializab ...

  4. CF296C Greg and Array 查分数组

    题目链接:http://codeforces.com/problemset/problem/296/C 题意:给你n.m.k,表示n个数a[i],m个对数的操作,k个对操作的操作.m个操作:数a[l] ...

  5. NIM游戏,NIM游戏变形,威佐夫博弈以及巴什博奕总结

    NIM游戏,NIM游戏变形,威佐夫博弈以及巴什博奕总结 经典NIM游戏: 一共有N堆石子,编号1..n,第i堆中有个a[i]个石子. 每一次操作Alice和Bob可以从任意一堆石子中取出任意数量的石子 ...

  6. Bless You Autocorrect!

    题目链接: https://odzkskevi.qnssl.com/0c87453efec2747f8e8a573525fd42f9?v=1533651456 题解: 这是一道Trie+BFS的题目: ...

  7. Oracle - 给rac创建单实例dg,并做主从切换

    一.概述 本文将介绍如何给rac搭建单节点的dg,以及如何对其进行角色转换.预先具备的知识(rac搭建,单实例-单实例dg搭建) 二.实验环境介绍 主库rac(已安装rac,并已有数据库orcl)ra ...

  8. Redis 使用消息隊列

    關鍵函數 ListRightPush  生產消息 ListRightPop   消費消息 這是從右面增或取 左邊亦然

  9. 【Taro】363- 玩转 Taro 跨端之 flex 布局篇

    Taro 是一套遵循 React 语法规范的跨平台开发解决方案,但是目前当我们使用 Taro 的时候,在不同平台上的开发体验还有不一致的地方,所以我们也都期待有一套跨平台统一的解决方案,能够以最小差异 ...

  10. 大数据学习笔记——Spark工作机制以及API详解

    Spark工作机制以及API详解 本篇文章将会承接上篇关于如何部署Spark分布式集群的博客,会先对RDD编程中常见的API进行一个整理,接着再结合源代码以及注释详细地解读spark的作业提交流程,调 ...