NumPy 学习(1): ndarrays
Numpy 是Numerical Python的简写,用来进行高性能的科学计算以及数据分析的基础包。它是一些高级工具(pandas)的基础。它主要提供以下几个功能:
(1). ndarray:计算快,空间效率高的多纬的数组
(2). 快速操作数组的标准数学函数
(3). 向磁盘读写数据的工具,提供内存影射文件功能
(3). 线性代数,随机数生成器,傅立叶变换功能
(4). 整合用C,C++,以及Fortran写的代码的工具 (Python生态系统宗重要的功能)
事实上Numpy本身没有提供太多数据分析的函数,但是理解NumPy的数组,以及面向数组的计算对后期学习pandas等工具有很大的帮助。
1. ndarray , 多维数组对象
多维数组对象是NumPy的一个重要特点,它为庞大的数据集提供一个运算快且灵活的容器。
(1). 简单创建一个数组,通过调用pandas.array(),前提是需要引入numpy包,这里我门为了方便调用,将其重命名为np
In [6]: import numpy as np In [7]: a = [6,7.5,8,0,1]
# 用创建的list对象来创建array对象
In [8]: arr1 = np.array(a) In [9]: arr1
Out[9]: array([ 6. , 7.5, 8. , 0. , 1. ])
(2). 用嵌套序列来创建数组
n [12]: data2 = [[1, 2, 3, 4], [5, 6, 7, 8]] In [13]: arr2 = np.array(data2) In [14]: arr2
Out[14]:
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
(3). 除了用np.array 来创建数组外,还有一些其他的函数来创建新的数组。
zeros 和 ones 函数可以分别用来创建0,和1 元素的数组。
In [15]: np.zeros(10)
Out[15]: array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
In [16]: np.ones((3,5))
Out[16]:
array([[ 1., 1., 1., 1., 1.],
[ 1., 1., 1., 1., 1.],
[ 1., 1., 1., 1., 1.]])
通过np.empty 创建一个由任意数初始化的数组
In [21]: np.empty((2,3,2))
Out[21]:
array([[[ 6.91210571e-310, 1.97791711e-316],
[ 0.00000000e+000, 0.00000000e+000],
[ 0.00000000e+000, 0.00000000e+000]], [[ 0.00000000e+000, 0.00000000e+000],
[ 0.00000000e+000, 0.00000000e+000],
[ 0.00000000e+000, 0.00000000e+000]]])
通过arrange函数创建:
In [28]: np.arange(10)
Out[28]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
(4). 查看数组属性
# 查看数组维度
In [24]: arr2.ndim
Out[24]: 2
# 查看数组大尺寸
In [25]: arr2.shape
Out[25]: (2, 4)
# 查看数组元素类型
In [26]: arr2.dtype
Out[26]: dtype('int64')
。。。。。
2. ndarrays 的数据类型:
在创建数组的时候可以指定数据元素的类型,用dtype指定类型,说明在解析数组所在内存空间的时候采用什么方式。这使得NumPy 更加强大和易用。
在大多数情况下,NumPy是直接类型映射成底层的二进制,这使得其更容易以二进制流的方式去读写数据。
In [3]: arr1 = np.array([1,2,3,4],dtype = np.float64) In [4]: arr2 = np.array([4,3,2,1],dtype = np.int32) In [5]: arr1.dtype
Out[5]: dtype('float64') In [6]: arr2.dtype
Out[6]: dtype('int32')
数据类型表:


可以显示的将一种类型强转为另一种类型,这时需要使用astye函数
In [7]: arr2.dtype
Out[7]: dtype('int32')
In [8]: float_arr2 = arr2.astype(np.float64)
In [9]: float_arr2
Out[9]: array([ 4., 3., 2., 1.])
In [10]: float_arr2.dtype
Out[10]: dtype('float64')
但是当把浮点类型转化为整形的时候会出现截断:
In [11]: arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1]) In [12]: arr.astype(np.int32)
Out[12]: array([ 3, -1, -2, 0, 12, 10], dtype=int32)
也可以把字符串表示的数字转换为数值类型,但是可能在转换过程中出错,因为有的字符串无法转换为数值类型。
In [13]: numeric_strings = np.array(['1.25', '-9.6', ''], dtype=np.string_) In [14]: numeric_strings.astype(float)
Out[14]: array([ 1.25, -9.6 , 42. ])
3. 运算
可以在NumPy的数组之间,以及数组和数字之间作运算。
In [15]: arr = np.array([[1., 2., 3.], [4., 5., 6.]]) In [16]: arr
Out[16]:
array([[ 1., 2., 3.],
[ 4., 5., 6.]])
# 数组间乘法
In [17]: arr * arr
Out[17]:
array([[ 1., 4., 9.],
[ 16., 25., 36.]])
# 数组间减法
In [18]: arr - arr
Out[18]:
array([[ 0., 0., 0.],
[ 0., 0., 0.]])
# 数和数组的除法
In [19]: 1 / arr
Out[19]:
array([[ 1. , 0.5 , 0.33333333],
[ 0.25 , 0.2 , 0.16666667]])
# 数和数组的乘法
In [20]: arr * 0.5
Out[20]:
array([[ 0.5, 1. , 1.5],
[ 2. , 2.5, 3. ]])
不同尺寸大小的数组间也是可以运算的。
NumPy 学习(1): ndarrays的更多相关文章
- (转)Python数据分析之numpy学习
原文:https://www.cnblogs.com/nxld/p/6058572.html https://morvanzhou.github.io/tutorials/data-manipulat ...
- NumPy学习笔记 三 股票价格
NumPy学习笔记 三 股票价格 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.&l ...
- NumPy学习笔记 二
NumPy学习笔记 二 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...
- NumPy学习笔记 一
NumPy学习笔记 一 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...
- 数据分析之Pandas和Numpy学习笔记(持续更新)<1>
pandas and numpy notebook 最近工作交接,整理电脑资料时看到了之前的基于Jupyter学习数据分析相关模块学习笔记.想着拿出来分享一下,可是Jupyter导出来h ...
- NumPy学习(索引和切片,合并,分割,copy与deep copy)
NumPy学习(索引和切片,合并,分割,copy与deep copy) 目录 索引和切片 合并 分割 copy与deep copy 索引和切片 通过索引和切片可以访问以及修改数组元素的值 一维数组 程 ...
- NumPy学习(让数据处理变简单)
NumPy学习(一) NumPy数组创建 NumPy数组属性 NumPy数学算术与算数运算 NumPy数组创建 NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型. 它描述相同 ...
- numpy 学习笔记
numpy 学习笔记 导入 numpy 包 import numpy as np 声明 ndarray 的几种方法 方法一,从list中创建 l = [[1,2,3], [4,5,6], [7,8,9 ...
- numpy 学习总结
numpy 学习总结 作者:csj更新时间:01.09 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结: 回主目录:2017 年学习记录和总结 #生成数组/使 ...
- Numpy学习1
NumPy学习(1) 参考资料: http://www.cnblogs.com/zhanghaohong/p/4854858.html http://linusp.github.io/2016/02/ ...
随机推荐
- SSH框架中json传递失败
错误截图: 这个错误乍一看无从下手,报的都是框架底层的错误,于是查阅资料得到了答案. 错误原因:struts会将action中定义的一些变量序列化转换成json格式,需要调用对象的一系列get方法,并 ...
- asp.net 上一条和下一条记录的显示
这里我用的是input标签跳转页面的: 前台aspx页面中: <input class="btn" id="btnSetForm" type=" ...
- CSS设置超出指定宽度自动换行
一.背景 最近项目中有用到在div中显示用户反馈的信息,是指定宽度的div,超出要自动换行,开始写好后感觉应该没什么问题,后来自己随便输入测试数据的时候发现:如果是纯字母或者是纯数字就会出现超出了也不 ...
- Android笔记:菜单
1.按键调出菜单 public boolean onCreateOptionsMenu(Menu menu) 重写建立菜单方法 public boolean onOptionsItemSelected ...
- September 20th 2016 Week 39th Tuesday
Failure is not fatal, but failure to change might be. 失败并不致命,但无法改变却可能是致命的. I need change, but it see ...
- Linux将Shelll输出写入到文件
&> 以覆盖的方式,写入文件 &>> 将输出追加到文件 将命令的正确输出与错误输出都放入文件. /dev/null,垃圾箱. 将无用输出放入垃圾箱. 命令>& ...
- poj2492(种类并查集/各种解法)
题目链接: http://poj.org/problem?id=2492 题意: 有t组测试数据, 对于每组数据,第一行n, m分别表示昆虫的数目和接下来m行x, y, x, y表示教授判断x, y为 ...
- Jmeter 中通过(_time函数)获取10位时间戳的方法
meter的__time函数作用是取当前时间的时间戳,默认取的时间精确到了毫秒级别,所以获取的时间戳默认是13位的. 下图为取10位的时间戳的函数表达式(时间精确到秒)
- c# 扩展方法奇思妙用基础篇八:Distinct 扩展(转载)
转载地址:http://www.cnblogs.com/ldp615/archive/2011/08/01/distinct-entension.html 刚看了篇文章 <Linq的Distin ...
- poj 1701【数学几何】
The area Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Su ...