Numpy学习笔记

ndarray多维数组

创建

import numpy as np
np.array([1,2,3,4])
np.array([1,2,3,4,],[5,6,7,8])
np.zeros(8)
np.zeros(3,4)
np.ones(4)
np.one_like([1,2,3,4])
np.empty((2,2,2))
np.arange(10)

数组创建函数

  • arange
  • ones/ones_like
  • zeros/zeros_like
  • empty/empty_like
  • eye/identity

属性

  • ndim: 轴的个数
  • shape: 数组的维度
  • size: 元素总个数
  • dtype: 数据类型
  • itemsize: 每个元素的字节大小

数据类型

  • float
  • int
  • complex
  • bool
  • string_
  • object

类型转换

attr1.astype(np.float64)  # np.float64和'float64'都可以
attr1.astype('string_')
attr1.astype('int32')

数组变换

  • reshage: 变换
  • flattern: 扁平
  • ravel: 散开
arr1 = np.arrary(9)
arr.reshape((3,3))
arr.reshape((3, -1)) # -1根据数据数据本身/3决定

3种变换(数据重塑)都不会修改原数组

  • concatenate: 合并
  • split: 拆分
arr1 = np.arrage(12).reshape(3, 4)
arr2 = np.arrange(12,24).reshape(3,4)
np.concatenate([arr1, arr2], axis=0) # 相当于np.vstack([arr1, arr2])
np.concatenate([arr1, arr2], axis=1) # 相当于np.hstack([arr1, arr2])
np.split(arr1, [2, 4])
  • transpose: 数组转制(只支持2维)
  • swapaxes: 轴对换(支持多维)
arr1 = np.arange(12).reshape(3,4)
arr1.transpose((1,0)) # 相当于 arr1.T arr2 = np.arrage(16).reshape(2,2,4)
arr2.swapaxes(1,2) # 交换y,z轴

随机函数(random)

  • rand: 均匀分布的样品值
  • randint: 随机整数
  • randn: 平均数为0, 标准差为1的正态分布随机数
  • normal: 指定平均数和标准差的正态分布数组
  • seed: 随机种子
  • permutation: 随机排序, 不改变原数组
  • shuffle: 随机排序,改变原数组
  • uniform(low, high, size): 均匀分布的数组
  • poisson(lam, size): 泊松分布数组
arr1 = np.random.randint(100, 200, size=(5,4))
np.random.randn(2,3,5)
np.random.normal(4,5,size=(3,5))
np.random.permutation(arr1)
np.random.shuffle(arr1)

数组的索引和切片

  • 索引支持多维索引arr1[2,3] 或arr1[2][3]
  • 索引值为原数组的视图, 修改arr1[2,3]会修改原数组(如并不想修改需使用arr1[2,3].copy())
  • 切片支持多维切片arr1[2:, :-1]
  • 布尔型索引 datas[fruits==0] = 1 # 筛选赋值
  • 花式索引: arr[np.ix_([3,2],[2,1]) # arr[[3,2]][:,[2,1]]

数组运算

标量运算

arr1 = np.array([1, 2, 3])
arr1 * 10
arr1 * arr1
arr1 - arr1

通用函数

  • abs: 绝对值
  • square: 平方
  • add: 两个数组相加
  • minimum: 计算最小值
  • modf: 分割整数部分和小数部分

可以指定axis轴

条件逻辑运算

  • np.where(cond, arr1, arr2) # 类似3元表达式

统计运算

  • sum: 求和
  • mean: 求算术平均数
  • std/var: 求标准差/方差
  • min/max: 最小数/最大数
  • argmin/argmax: 最小数/最大数索引
  • cumsum: 所有元素的累加和
  • cumprod 所有元的累计积
  • all/any: 布尔类型运算

集合运算

  • np.unique: 找出所有唯一值,并排序
  • np.inld: 是否包含指定的值
  • np.intersect1d: 公共元素
  • np.union1d: 并集
  • np.setdiff1d: 差集
  • setxor1d: 交集取反

线性代数

  • np.dot: 点积
  • from numpy.linalg import det ...

数组存取

  • np.loadtxt: 读取
arr1 = np.loadtxt('1.csv', delimiter=',')

示例: 图像变换

Python数据分析:Numpy学习笔记的更多相关文章

  1. python数据分析入门学习笔记

    学习利用python进行数据分析的笔记&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分 ...

  2. python数据分析入门学习笔记儿

    学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据 ...

  3. 利用python数据分析panda学习笔记之基本功能

    1 重新生成索引 如果某个索引值不存在就引入缺失值 from pandas import Series,DataFrame import pandas as pd import numpy as np ...

  4. 利用python数据分析panda学习笔记之Series

    1 Series a:类似一维数组的对象,每一个数据与之相关的数据标签组成 b:生成的左边为索引,不指定则默认从0开始. from pandas import Series,DataFrame imp ...

  5. 利用python数据分析panda学习笔记之DataFrame

    2 DataFrame a:通过传入一个等长的列表构成DataFrame 自动加上索引 data={'state':['ohio','ohio','ohio','Nevada','Nevada'], ...

  6. $《利用Python进行数据分析》学习笔记系列——IPython

    本文主要介绍IPython这样一个交互工具的基本用法. 1. 简介 IPython是<利用Python进行数据分析>一书中主要用到的Python开发环境,简单来说是对原生python交互环 ...

  7. NumPy学习笔记 三 股票价格

    NumPy学习笔记 三 股票价格 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.&l ...

  8. NumPy学习笔记 二

    NumPy学习笔记 二 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...

  9. NumPy学习笔记 一

    NumPy学习笔记 一 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.<数学分 ...

随机推荐

  1. centos中拉取postgre

    新搭建好的linux服务器环境,docker也配置好了. 第一步,下载postgre docker pull postgres:11 这里的版本号自己按照自己的需要来获取. 然而实际上没那么顺利,直接 ...

  2. JVM描述符标识字符含义

    标识字符 含义 B byte C char D double F float I int J long S short Z boolean V void L 对象类型,如Ljava/lang/Obje ...

  3. 【C++】如何提高Cache的命中率,示例

    参考链接     https://stackoverflow.com/questions/16699247/what-is-a-cache-friendly-code 只是堆积:缓存不友好与缓存友好代 ...

  4. # 机器学习算法总结-第一天(KNN、决策树)

    KNN算法总结 KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别.(监督) k近邻算法(knn)是一种基本的分类与回归的算法,k-mea ...

  5. 14.SpringMVC核心技术-类型转换器

    类型转换器 在前面的程序中,表单提交的无论是 int 还是 double 类型的请求参数,用于处理该请求 的处理器方法的形参, 均可直接接收到相应类型的相应数据,而非接收到 String 再手工转换. ...

  6. linux之getopts

    在编写shell脚本中,经常要处理一些输入参数,在使用过程中发现getopts更加方便,能够很好的处理用户输入的参数和参数值. getopts用于处理用户输入参数,举例说明使用方法: while ge ...

  7. 【python】python _、__、__xx__之间的差别

    本文来自 yzl11 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/yzl11/article/details/53792416?utm_source=copy 单下 ...

  8. 第三章、前端之JavaScript

    目录 第三章.前端之JavaScript 一.javaScript的引入方式 二.JavaScript语言的规范 三.语言基础 变量声明 四.数据类型 五.流程控制 六.函数 函数的argument ...

  9. django框架—终端命令

    创建一个虚拟环境:在虚拟环境中创建项目目录 cd到项目根目录 创建项目:django-admin startproject "项目名称" 创建app:python manage.p ...

  10. 使用pymysql进行定时查询数据不更新的原因及解决方式

    用python写了一个小脚本定时查询数据库,输出查询结果并写入文件,发现每次查询的结果都是相同的,但是数据库确实在更新数据. 原因: REPEATABLE READ The default isola ...