数据分析第三篇：Numpy知识点

Numpy

将字符型数据转为datetime

import numpy as np

f = np.array(['','2019-01-01','2019-01-02 01:01:01'])

# 把f数组的元素类型改为日期类型

g = f.astype('M8[D]') # M8[Y] M8[M] M8[D]

print(g)

# 时间戳（将日期转为数） 上面g的单位不同，这边的数值也不同

# g中的值距离1970年总共有多少天

h = g.astype('int32')

print(h)

print(h[] - h[])

生成ndarray数组

- np.random.random((2,2))
- np.ones((3,4))
- np.zeros((2,2), dtype='int32')
- np.arange(1,10)
- np.linspace(0,2,10)
- np.eye(3)
- np.full((3,3),7)

np.random.random((,))

Out[]:

array([[ 0.61705652, 0.48264423],

[ 0.69303143, 0.35004567]])

np.ones((,))

Out[]:

array([[ ., ., ., .],

[ ., ., ., .],

[ ., ., ., .]])

np.zeros((,), dtype='int32')

Out[]:

array([[, ],

[, ]])

np.arange(,)

Out[]: array([, , , , , , , , ])

np.linspace(,,)

Out[]:

array([ . , 0.22222222, 0.44444444, 0.66666667, 0.88888889,

1.11111111, 1.33333333, 1.55555556, 1.77777778, . ])

np.eye()

Out[]:

array([[ ., ., .],

[ ., ., .],

[ ., ., .]])

np.full((,),)

Out[]:

array([[, , ],

[, , ],

[, , ]])

Numpy 的random模块

# 使用numpy.random的normal函数生成符合二项分布的随机数

n =

# ：期望值

# ：标准差

# n：数字生成数量

x= np.random.normal(, , n)

y= np.random.normal(, , n)

ndarray数组对象的维度操作

视图变维：array.reshape() array.ravel()

- ravel() 是扁平化但是不复制，公用一个对象
- flatten() 是扁平化同时复制，会生成一个新对象并且返回

import numpy as np

a = np.arange(,)

# 视图变维使用的还是原始数组中的数据，如果修改了原始数组中的数据，那么新数组读到的数据也会发生变化。

b = a.reshape((,))

print(a,b)

a[] =

print(b)

c = b.ravel()

print(c)

复制变维（数据独立）：flatten()

# 测试flatten

d=b.flatten().reshape((,))

d[] =

print(b)

print(d)

就地变维：直接修改数组维度，不返回新数组 resize() shape

d.resize(,,)

d.shape=(,)

print(d)

ndarray数组的切片操作

# 数组的切片与列表的切片参数类似

# 步长为正：默认从前往后切

# 步长为负：默认从后往前切

array[起始位置:终止位置:步长]

a = np.arange(,) # array([, , , , , , , , ])

a.resize(,) # array([[, , ],

# [, , ],

# [, , ]])

a[:, :] # 第2行到最后一行，所有列

ndarray数组的掩码操作

a = np.array([,,,,,,,])

f = np.array([True, False, True, False,False, True, False, True])

a[f]

Out[]: array([, , , ])

# 现在有数组的1-，我们现在要拿到数组中3的倍数或7的倍数

flag_a = a%==

flag_b = a%==

flag_a

Out[]:

array([False, False, True, False, False, True, False, False, True,

False, False, False, False, False, ... False, False, False,

False, False, True, False, False, True, False, False, True, False], dtype=bool)

flag = np.any([flag_a, flag_b], axis=)

a[flag]

Out[]:

array([ , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , ,

, , , , , , , , ])

多维数组的组合和拆分

垂直方向的操作：vstack() vsplit()

a = np.arange(,).reshape(,)

b = np.arange(,).reshape(,)

a

Out[]:

array([[, , ],

[, , ]])

b

Out[]:

array([[ , , ],

[, , ]])

c = np.vstack((a,b))

c

Out[]:

array([[ , , ],

[ , , ],

[ , , ],

[, , ]])

a,b = np.vsplit(c, )

水平方向的操作：hstack() hsplit()

d = np.hstack((a,b))

a,b = np.hsplit(d, )

深度方向的操作：dstack() dsplit() 二维数组深度操作会变为三维数组，最后拆分也是三维数组

a

Out[]:

array([[, , ],

[, , ]])

b

Out[]:

array([[ , , ],

[, , ]])

e = np.dstack((a,b))

e

Out[]:

array([[[ , ],

[ , ],

[ , ]],

[[ , ],

[ , ],

[ , ]]])

a,b = np.dsplit(e,)

a

Out[]:

array([[[],

[],

[]],

[[],

[],

[]]])

多维数组组合与拆分的相关函数

# 根据axis所指定的轴向（,,）进行多维数组的组合

# 如果待组合的两个数组都是二维数组

# axis=:垂直方向

# axis=:水平方向

# 如果待组合的两个数组都是三维数组

# axis=:垂直方向

# axis=:水平方向

# axis=:深度方向

np.concatenate((a,b), axis=)

# 通过axis给定的轴向和拆分的份数对c进行拆分

np.split(c,,axis=)

长度不等的两个数组的组合操作

np.pad(ary, # 原始数组

pad_width=(,), # 补全方式（头部补0个，尾部补1个）

mode='constant', # 设置补全模式

constant_values=-) # 设置补全的默认值为-

a = np.arange(,)

a

Out[]: array([, , , ])

# 返回一个新数组

np.pad(a, pad_width=(,),mode='constant',constant_values=-)

Out[]: array([ , , , , -, -, -])

简单的一维数组的组合方案

a = np.arange(,)

b = np.arange(,)

# 垂直方向叠加

np.row_stack((a,b))

# 水平方向叠加

np.column_stack((a,b))

Numpy数组的其他属性

1.shape 维度

2.dtype 元素类型

3.size 元素的个数

4.ndim 维度

5.itemsize 元素字节数

6.nbytes 数组的总字节数

7.real 复数数组的实部

8.imag 复数数组的虚部

9.T 数组对象的转置视图

10.flat 返回数组的扁平迭代器

a = np.arange(,)

a.resize(,,)

a.size

Out[]: 

len(a)

Out[]: 

a.ndim

Out[]: 

a.shape

Out[]: (, , )

a.dtype

Out[]: dtype('int32')

a.dtype.name

Out[]: 'int32'

# ndarray数组的扁平迭代器

for i in a.flat:

print(i)

[e for e in a.flat]

数据分析第三篇：Numpy知识点的更多相关文章

【Python数据挖掘】第三篇--Numpy 和可视化
一.Numpy 数组是一系列同类型数据的集合,可以被非零整数进行索引,可以通过列表进行数组的初始化,数组也可以通过索引进行切片. Numpy提供了几乎全部的科学计算方式. # numpy 导入方式: ...
数据分析之路第一篇 numpy
第一篇 numpy 1.N维数组对象 :ndarray在Python中既然有了列表类型,为啥还要整个数组对象(类型)?那是因为:1.数组对象可以除去元素间运算所需要的循环,使得一维向量更像单个数据2. ...
java面试必备知识点-上中下三篇写的很详细
参考博客:写的还是相当的经典 http://www.cnblogs.com/absfree/p/5568849.html 上中下三篇写的很详细 http://blog.csdn.net/riverfl ...
python数据挖掘第三篇-垃圾短信文本分类
数据挖掘第三篇-文本分类文本分类总体上包括8个步骤.数据探索分析->数据抽取->文本预处理->分词->去除停用词->文本向量化表示->分类器->模型评估.重 ...
Spring第二篇和第三篇的补充【JavaConfig配置、c名称空间、装载集合、JavaConfig与XML组合】
前言在写完Spring第二和第三篇后,去读了Spring In Action这本书-发现有知识点要补充,知识点跨越了第二和第三篇,因此专门再开一篇博文来写- 通过java代码配置bean 由于Spr ...
C#多线程编程（4）--异常处理+前三篇的总结
本来是打算讲并行For和PLINQ的,但是我感觉前三篇我没有讲得很清晰.之前一直在看<CLR via C#>(后文简称CLR)的多线程部分,其中有些部分不是很明白,今天翻开<果壳中的 ...
python数据分析---第04章 NumPy基础：数组和矢量计算
NumPy(Numerical Python的简称)是Python数值计算最重要的基础包.大多数提供科学计算的包都是用NumPy的数组作为构建基础. NumPy的部分功能如下: ndarray,一个具 ...
spring-cloud-kubernetes背后的三个关键知识点
在<你好spring-cloud-kubernetes>一文中,对spring-cloud-kubernetes这个SpringCloud官方kubernetes服务框架有了基本了解,今天 ...
《VueRouter爬坑第三篇》-嵌套路由
VueRouter系列的文章示例编写时,项目是使用vue-cli脚手架搭建. 项目搭建的步骤和项目目录专门写了一篇文章:点击这里进行传送后续VueRouter系列的文章的示例编写均基于该项目环境. ...

随机推荐

[译]GLUT教程 - 整合代码4
Lighthouse3d.com >> GLUT Tutorial >> Pop-up Menus >> The Code So Far IV 以下代码使用了位图字 ...
[WebGL入门]二十五，点光源的光照
注:文章译自http://wgld.org/,原作者杉本雅広(doxas),文章中假设有我的额外说明.我会加上［lufy:］.另外,鄙人webgl研究还不够深入,一些专业词语.假设翻译有误,欢迎大家指 ...
自定义一个更好用的SwipeRefreshLayout（弹力拉伸效果详解）（转载）
转自: 自定义一个更好用的SwipeRefreshLayout(弹力拉伸效果详解) 前言熟悉SwipeRefreshLayout的同学一定知道,SwipeRefreshLayout是android里 ...
Cobbler部署之FAQ处理
Cobbler报错处理通过cobbler check检查出现的报错红色标注为报错关键信息 9.1 报错一 # cobbler check httpd does not appear to be r ...
创建有提示的ui组件
using UnityEditor; using UnityEngine; using System.Collections; using Edelweiss.CloudSystem; namespa ...
Java线程面试题：子线程先运行 2 次，然后主线程运行 4 次，如此反复运行 3 次
package thread; /** * 需求:线程编程:子线程先运行 2 次,然后主线程运行 4 次,如此反复运行 3 次. * @author zhongfg * @date 2015-06-1 ...
百度地图SnapshotReadyCallback截屏
今天碰到了地图截图的功能,不太会,查查资料知道怎么弄了,跟大家分享一下直接上代码,弄了一个方法,将截取的图片上传至服务器,返回给我们图片路径 //获取地图截图 private void getscr ...
Centos 安装libreoffice 生成office 报错信息见内容
个人博客:https://blog.sharedata.info/ 错误信息:/opt/libreoffice5.2/program/soffice.bin: error while loading ...
python 基础 9.6 设计表结构
一. 设计表结构在操作设计数据库之前,我们先要设计数据库表结构,我们就来分析分析经典的学生,课程,成绩,老师这几者他们之间的关系,我们先来分析各个主体他们直接有什么属性,并确定表结构,在实际开 ...
软件测试人员需要精通的开发语言（3）--- Linux
Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户.多任务.支持多线程和多CPU的操作系统.不得不说下,中国产的红旗系统,牛的一逼,造价很贵,但具体何用处估 ...