学机器学习做点小笔记，都是Python的NumPy库的基本小操作，图书馆借的书看到的，怕自己还了书后忘了，就记下来。

一般习惯导入numpy时使用 import numpy as np ，不要直接import，会有命名空间冲突。比如numpy的array和python自带的array。

numpy下有两个可以做矩阵的东西，一个叫matrix，一个叫array。matrix指定是二维矩阵，array任意维度，所以matrix是array的分支，但是这个matrix和matlab的矩阵很像，操作也很像：

>>> import numpy as np

>>> a=np.mat('4 3; 2 1')  # 使用字符串来初始化

>>> b=np.mat('1 2; 3 4')

>>> a

matrix([[4, 3],

        [2, 1]])

>>> b

matrix([[1, 2],

        [3, 4]])

>>> a+b  # 对应位置相加

matrix([[5, 5],

        [5, 5]])

>>> a*b  # 矩阵乘法，与matlab相同

matrix([[13, 20],

        [ 5,  8]])

>>> np.multiply(a,b)  # 对应位置乘法，相当于matlab的点乘 “.*”

matrix([[4, 6],

        [6, 4]])

而重点讲讲np.array。

np.array操作

首先是初始化与属性查看

>>> import numpy as np

>>> np.arange(10)  # 从零生成到10-1的一维矩阵

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

>>> a=np.array([0,1,2,3,4,5])  # 因为支持多维，所以用数组来初始化

>>> a

array([0, 1, 2, 3, 4, 5])

>>> a.ndim  # 查看维度

1

>>> a.shape  # 查看矩阵形状尺寸

(6,)

>>> a.dtype  # 查看类型

dtype('int32')

reshape改变矩阵形状，可以改变维度，但是reshape后的数据还是共享原来那一份数据

>>> b=a.reshape(3,2)

>>> b

array([[0, 1],

       [2, 3],

       [4, 5]])

>>> b.ndim

2

>>> b.shape

(3, 2)

>>> b[1][0]=77

>>> b

array([[ 0,  1],

       [77,  3],

       [ 4,  5]])

>>> a

array([ 0,  1, 77,  3,  4,  5])  # 可见b和a其实用的同一个数据

因而要产生的新矩阵不再关联，要使用copy()：

>>> c=a.reshape(3,2).copy()

>>> c

array([[ 0,  1],

       [77,  3],

       [ 4,  5]])

>>> c[0][0]=233

>>> a

array([ 0,  1, 77,  3,  4,  5])

>>> c

array([[233,   1],

       [ 77,   3],

       [  4,   5]])

array的运算：

>>> d=np.array([1,2,3,4,5])  # 一维矩阵运算

>>> d.T  # 转置矩阵

array([1, 2, 3, 4, 5])

>>> d*2  # 每个数据乘以2

array([ 2,  4,  6,  8, 10])

>>> d**2  # 每个数据二次方

array([ 1,  4,  9, 16, 25])

>>> d*d   # 按位置乘，与“d**2”等效，和mat正好相反

array([ 1,  4,  9, 16, 25])

>>> d.dot(d)  # 矩阵乘法，和mat相反

55

>>> x=np.array([[1,2],[3,4],[5,6]])  # 二维矩阵运算

>>> y=np.array([[6,5,4],[3,2,1]])

>>> x

array([[1, 2],

       [3, 4],

       [5, 6]])

>>> y

array([[6, 5, 4],

       [3, 2, 1]])

>>> x.dot(y)  # 二维矩阵矩阵乘法

array([[12,  9,  6],

       [30, 23, 16],

       [48, 37, 26]])

>>> x= x.reshape(2,3)

>>> x

array([[1, 2, 3],

       [4, 5, 6]])

>>> x*y  # 按位置乘，要求两个矩阵shape相同

array([[ 6, 10, 12],

       [12, 10,  6]])

>>> x.T  # 二维矩阵的转置矩阵

array([[1, 4],

       [2, 5],

       [3, 6]])

>>> x.mean()  # 求平均值

3.5

关于下标的运算：（这些挺有意思的）

>>> a=np.array([5,4,3,233,9])

>>> a[np.array([2,4,3])]  # 列出对应下标的数值

array([  3,   9, 233])

>>> a>4

array([ True, False, False,  True,  True], dtype=bool)

>>> a[a>4]

array([  5, 233,   9])

>>> a[a>8]=8

>>> a

array([5, 4, 3, 8, 8])

>>> a.clip(4,5)  # 限定所有数据范围

array([5, 4, 4, 5, 5])

还有一个关于nan的

>>> a=np.array([1,2,0,3,4])

>>> a

array([1, 2, 0, 3, 4])

>>> b=np.array([1,2,np.NAN,3,4])

>>> b

array([  1.,   2.,  nan,   3.,   4.])  # 和a不同，虽然只改了一个nan，b每个数据后面有个“.”，说明变成float型了，说明nan其实是个float

>>> np.isnan(b)

array([False, False,  True, False, False], dtype=bool)

>>> b[~np.isnan(b)]

array([ 1.,  2.,  3.,  4.])

与系统自带array的差异

array的乘法

>>> [1,2,3,4,5]*2

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5]

>>> [1,2,3,4,5]**2

(报错)

运行时间

对array和np.array进行按元素平方并求和的运算，运算3000次统计时间。

>>> timeit.timeit('sum(x*x for x in range(1000))',number=3000)

0.31559807779291305

>>> timeit.timeit('sum(na*na)', setup='import numpy as np; na=np.arange(1000)',number=3000)

0.37785958035067324

>>> timeit.timeit('na.dot(na)', setup='import numpy as np; na=np.arange(1000)',number=3000)

0.0069067372806728144

惊奇的发现系统级的array求和比np.array还快，说明np.array单个数据的访问还是比array较慢。但是用了矩阵乘法后，虽然效果一样，但这个速度就飞起来了。

[笔记]NumPy基础操作的更多相关文章

[学习笔记] Numpy基础系统学习
[学习笔记] Numpy基础上专业选修<数据分析程序设计>课程,老师串讲了Numpy基础,边听边用jupyter敲了下--理解+笔记. 老师讲的很全很系统,有些点没有记录,在PPT里就不 ...
numpy 基础操作
Numpy 基础操作¶ 以numpy的基本数据例子来学习numpy基本数据处理方法主要内容有: 创建数组数组维度转换数据选区和切片数组数据计算随机数数据合并数据统计计算 In [1]: ...
笔记-flask基础操作
笔记-flask基础操作 1. 前言本文为flask基础学习及操作笔记,主要内容为flask基础操作及相关代码. 2. 开发环境配置 2.1. 编译环境准备安装相关Lib ...
NumPy基础操作
NumPy基础操作(1) (注:记得在文件开头导入import numpy as np) 目录: 数组的创建强制类型转换与切片布尔型索引结语数组的创建相关函数 np.array(), np. ...
NumPy基础操作（3)——代数运算和随机数
NumPy基础操作(3)--代数运算和随机数 (注:记得在文件开头导入import numpy as np) 目录: NumPy在矩阵运算中的应用常用矩阵运算函数介绍编程实现利用NumPy生成随 ...
NumPy基础操作（2）
NumPy基础操作(2) (注:记得在文件开头导入import numpy as np) 目录: 写在前面转置和轴对换 NumPy常用函数写在前面本篇博文主要讲解了普通转置array.T.轴对换 ...
C#基础随手笔记之基础操作优化
对数据的查询,删除等基本操作是任何编程语言都会涉及到的基础,因此,研究了一下C#中比较常用的数据操作类型,并顺手做个笔记. List查询时,若是处理比较大的数据则使用HashSet<T>类 ...
[SQL] SQL学习笔记之基础操作
1 SQL介绍 SQL 是用于访问和处理数据库的标准的计算机语言.关于SQL的具体介绍,我们通过回答如下三个问题来进行. SQL 是什么? SQL,指结构化查询语言,全称是 Structured Qu ...
学习Numpy基础操作
# coding:utf-8 import numpy as np from numpy.linalg import * def day1(): ''' ndarray :return: ''' ls ...

随机推荐

pyqt样式表语法笔记(中)--原创
pyqt样式表语法笔记(中) pyqt QSS python 样式表一.弹窗在日常的各种桌面软件的使用中,我们都会碰到弹窗.例如注册,登录的时候,会有相应的信息弹窗,这里就以信息收集弹窗为例进行弹 ...
消息映射(C++)(转)
摘要:控件通知消息有很多种,但是有一种是很常用,但是又不是很容易掌握的,那就是WM_NOTIFY,我试着对此做一下比较全面的论述,有不对的地方,还希望各路大虾批评指正. 控件通知消息 ...
分布式文件管理系统_FastDFS集群
简单介绍 1,client storage tracker的关系先用一幅图来解释用户如何访问一个通过DFS管理的文件一般来说,一台服务器只有一个storage server,多个storage s ...
Linux批量清理多个文件内容而不删除文件
清理单个文件,可以这样:echo > myLog.log 但是,如果我要清理一堆文件,比如在/logs目录下面的所有以.log结尾的文件的内容,而不删除文件,该如何操作呢? 我一开始的语句是这样 ...
【转】轻应用、Web App、Native App三者分别是什么？
一.什么是Native app Native App是一种基于智能手机本地操作系统如IOS.Android.WP并使用原生程式编写运行的第三方应用程序,也叫地app.NativeApp因为位于平台 ...
Linux开机启动(bootstrap)下
init process (根据boot loader的选项,Linux此时可以进入单用户模式(single user mode).在此模式下,初始脚本还没有开始执行,我们可以检测并修复计算机可能存在 ...
老李分享：Android性能优化之内存泄漏1
老李分享:Android性能优化之内存泄漏前言对于内存泄漏,我想大家在开发中肯定都遇到过,只不过内存泄漏对我们来说并不是可见的,因为它是在堆中活动,而要想检测程序中是否有内存泄漏的产生,通常我 ...
（转）Java并发编程：并发容器之CopyOnWriteArrayList
原文链接:http://ifeve.com/java-copy-on-write/ Copy-On-Write简称COW,是一种用于程序设计中的优化策略.其基本思路是,从一开始大家都在共享同一个内容, ...
Struts2基础学习(七)—值栈和OGNL
目录: 一.值栈二.OGNL表达式一.值栈(ValueStack) 1.定义 ValueStack贯穿整个Acton的生命周期,每个Action类的对象实例都拥有一个ValueStack ...
JavaScript基础学习(二)—JavaScript基本概念
一.语法 1.区分大小写 JavaScript是一种弱类型的脚本语言.它区分大小写,变量名test与Test表示两个完全不同的变量. 2.标识符所谓标识符就是变量.函数.属性的 ...

[笔记]NumPy基础操作