一、Numpy简介：

Python中用列表(list)保存一组值，可以用来当作数组使用，不过由于列表的元素可以是任何对象，因此列表中所保存的是对象的指针。这样为了保存一个简单的[1,2,3]，需要有3个指针和三个整数对象。对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。此外Python还提供了一个array模块，array对象和列表不同，它直接保存数值，和C语言的一维数组比较类似。但是由于它不支持多维，也没有各种运算函数，因此也不适合做数值运算。

NumPy提供了两种基本的对象：ndarray（N-dimensional array object）和 ufunc（universal function object）。ndarray(下文统一称之为数组)是存储单一数据类型的多维数组，而ufunc则是能够对数组进行处理的函数。

二、nadrray对象：

1、创建一个数组对象:

函数生成：ones(),zeros(),eye(),diag()......

zeros:（4）,zeros(（5,2）)生成全0的数组

>>> import numpy as np

>>> np.zeros(5) //一维

array([ 0.,  0.,  0.,  0.,  0.])

>>> np.zeros((5,2))//二维

array([[ 0., 0.],

       [ 0., 0.],

       [ 0., 0.],

       [ 0., 0.],

       [ 0., 0.]])

　>>> np.zeros((5,2,2))//三维
array([[[ 0., 0.],
[ 0., 0.]],

[[ 0., 0.],
[ 0., 0.]],

[[ 0., 0.],
[ 0., 0.]]])

ones():生成全1的数组

>>> import numpy as np

>>> np.ones(10) //一维

array([ 1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.,  1.])

>>> np.ones(10,dtype="int32")//一维

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

>>> np.ones((4,1)) //二维
array([[ 1.],
[ 1.],
[ 1.],
[ 1.]])

arange函数：类似于list的range函数，通过指定初始值，终值，和步长来生成一维数组。（不包括终值）

import numpy as np
d = np.arange(0,10,1)

e =  np.arange(0,10,2)

print (d)

#----------------------------------

[0 1 2 3 4 5 6 7 8 9]

[0 2 4 6 8]

linspace函数：通过指定初始值，终值和 元素个数来创建一维数组。（默认包含终值，可用endpoint关键字指定包含终值）

f = np.linspace(0,10,11,endpoint=False)

print (f)

#----------------------------------------

[ 0.          0.90909091  1.81818182  2.72727273  3.63636364  4.54545455

  5.45454545  6.36363636  7.27272727  8.18181818  9.09090909]

logspace函数：类似linspace创建等比数列,下面的例子产生1(10^0)到100(10^2)、有20个元素的等比数列:

g = np.logspace(0,2,20)

print (g)

[   1.            1.27427499    1.62377674    2.06913808    2.6366509

    3.35981829    4.2813324     5.45559478    6.95192796    8.8586679

   11.28837892   14.38449888   18.32980711   23.35721469   29.76351442

   37.92690191   48.32930239   61.58482111   78.47599704  100.        ]

frombuffer,fromstring,fromfile等函数可以从字节序列创建数组。python自负产是字符序列，每个字符占一个字节，因此如果从字符串s创建一个8bit的整数数组的话得到的每个元书就是字符的ascii码值。

s= "abcdefgh"

sa = np.fromstring(s,dtype = np.int8)

print (sa)

#--------------------------------------

[ 97  98  99 100 101 102 103 104]

fromfuction函数：传入一个函数来创建数组

def fun(i,j):

    return (i+1)*(j+1)

fa = np.fromfunction(fun,(9,9)) #(9,9)表示数组的shape，传给fun的书是每个元素的定位，有81个位置，可以得到81个元素

print (fa)

#---------------------------------------------------

[[  1.   2.   3.   4.   5.   6.   7.   8.   9.]

 [  2.   4.   6.   8.  10.  12.  14.  16.  18.]

 [  3.   6.   9.  12.  15.  18.  21.  24.  27.]

 [  4.   8.  12.  16.  20.  24.  28.  32.  36.]

 [  5.  10.  15.  20.  25.  30.  35.  40.  45.]

 [  6.  12.  18.  24.  30.  36.  42.  48.  54.]

 [  7.  14.  21.  28.  35.  42.  49.  56.  63.]

 [  8.  16.  24.  32.  40.  48.  56.  64.  72.]

 [  9.  18.  27.  36.  45.  54.  63.  72.  81.]]

序列传入：

import numpy as np

a = np.array([1,2,3,4,5])

b = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])

print (a)

print (b)

#-------------------------------------------

[1 2 3 4 5]

[[ 1  2  3  4]

 [ 4  5  6  7]

 [ 7  8  9 10]]

2、数组的属性：

ndim属性：数组的维数

>>> np.ones((3,2))

array([[ 1.,  1.],

       [ 1.,  1.],

       [ 1.,  1.]])

>>> np.ones((3,2)).ndim

2 #二维

size：数组元素的总个数，等于shape属性中元组元素的乘积。
```
>>> np.ones((3,2)).size

6 #6个元素
```
dtype属性：查看或指定数组类型

print(a.dtype) # 数组的元素类型 int32，32bit整型数据

print(b.dtype) # 数组的元素类型 int32

aa = np.array([2,3,4,5,6],dtype = np.float)

print (aa)

#----------------------------------------------

[ 2.  3.  4.  5.  6.]

shape属性：查看或改变数组的大小

print(a.shape) #数组的大小 （5）

print(b.shape) #数组的大小 shape （3，4）

#修改shape来修改数组轴的大小：

b.shape = (4,3)

print (b)

#--------------------------------------

[[ 1  2  3]

 [ 4  4  5]

 [ 6  7  7]

 [ 8  9 10]]

#如果某个轴的值为-1，则会根据数组的总数计算此轴的长度。如b一共12个元素，修改shape

b.shape = (2,-1) #那么就会得到一个2*6的数组

print (b)

#--------------------------------------

[[ 1  2  3  4  4  5]

 [ 6  7  7  8  9 10]]

b.shape = (6,-1) #那么就会得到一个6*2的数组

print (b)

#--------------------------------------

[[ 1  2]

 [ 3  4]

 [ 4  5]

 [ 6  7]

 [ 7  8]

 [ 9 10]]

reshape属性：修改一个数组的尺寸得到一个新数组，原数组不变，但是这两个数组共享内存，如果修改值的话这两个数组都会变。

c = a.reshape((5,1)) #此方法实验证明:只能是x*y=数组的总元素才可以，这里1*5只能换成5*1

print (c) #此时a的结构并没改变,a,c共享内存。

print (a)

#--------------------------------------

[[1]

 [2]

 [3]

 [4]

 [5]]

[1 2 3 4 5]

#修改a[1][2]的值

a[2] = 100

print (c) #此时a的结构并没改变,a,c共享内存。

print (a)

#--------------------------------------

[1 2 3 4 5]

[[  1]

 [  2]

 [100]

 [  4]

 [  5]]

[  1   2 100   4   5]

3、数组存取：

切片法[[[----***逗号“，”分行，列。冒号“：”分范围***---]]]

>>> import numpy as np

>>> np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])

array([[ 1,  2,  3,  4],

       [ 4,  5,  6,  7],

       [ 7,  8,  9, 10]])

>>> b = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])

>>> b[0]

array([1, 2, 3, 4])

>>> b[1]

array([4, 5, 6, 7])

>>> b[1,2]

6

>>> b[1,3]

7

>>> b[1,-1]

7

>>> b[-1]

array([ 7,  8,  9, 10])

>>> b[-1,2]

9

>>> b[-1,-2]

9
>>> b[:-2] #0--负2列

array([[1, 2, 3, 4]])

>>> b[1:2]

array([[4, 5, 6, 7]])

>>> b[1:3]

array([[ 4,  5,  6,  7],

       [ 7,  8,  9, 10]])
#*************矩阵的截取***********************

>>> a=np.mat(np.random.randint(2,15,size=(3,3)))
>>> a
matrix([[ 4, 10, 14],
[11, 3, 12],
[ 4, 2, 12]])
>>> a[1:,1:,]
matrix([[ 3, 12],
[ 2, 12]])

三、矩阵对象matrix：

numpy库提供了matrix类，使用matrix类创建的是矩阵对象，它们的加减乘除运算缺省采用矩阵方式计算。但是由于NumPy中同时存在ndarray和matrix对象，因此很容易将两者弄混。

创建矩阵：matrix函数（也可以用简写mat） a = np.matrix([[1,2,3],[5,5,6],[7,9,9]])

#利用ones()创建一个2*4的全1矩阵

>>> np.mat(np.ones((2,4)))

matrix([[ 1.,  1.,  1.,  1.],

        [ 1.,  1.,  1.,  1.]])

#用numpy的随机数rand产生一个2*2的随机数组并转化成矩阵

>>> np.mat(np.random.rand(2,2))

matrix([[ 0.4340437 ,  0.98055453],

        [ 0.52937992,  0.81452857]])

#产生一个2-8之间的整数数组大小是2*5，再转换成矩阵。

>>> np.mat(np.random.randint(2,8,size=(2,5)))

matrix([[3, 6, 4, 4, 5],

        [3, 7, 7, 2, 3]])

#eye()函数产生单位对角数组，转换成单位对角阵

>>> np.mat(np.eye(2,2,dtype=int))

matrix([[1, 0],

        [0, 1]])

>>> np.mat(np.eye(3,2,dtype=int))

matrix([[1, 0],

        [0, 1],

        [0, 0]])

>>> np.mat(np.eye(3,3,dtype=int))

matrix([[1, 0, 0],

        [0, 1, 0],

        [0, 0, 1]])

#将一维数组转换成对角阵

>>> np.mat(np.diag([1,2,3]))

matrix([[1, 0, 0],

        [0, 2, 0],

        [0, 0, 3]])

>>>

矩阵运算：乘积，求逆，幂运算，转置

>>> import numpy as np

>>> a = np.matrix([[1,2,3],[5,5,6],[7,9,9]])

>>> a

matrix([[1, 2, 3],

        [5, 5, 6],

        [7, 9, 9]])

>>> a**-1 #求逆 a.I也是a的逆

matrix([[-0.6       ,  0.6       , -0.2       ],

        [-0.2       , -0.8       ,  0.6       ],

        [ 0.66666667,  0.33333333, -0.33333333]])

>>> a*a**-1 #a乘a的逆，矩阵内积

matrix([[  1.00000000e+00,   1.66533454e-16,  -1.11022302e-16],

        [  0.00000000e+00,   1.00000000e+00,  -4.44089210e-16],

        [  4.44089210e-16,   5.55111512e-17,   1.00000000e+00]])
>>> a.T #a的转置

matrix([[1, 5, 7],

        [2, 5, 9],

        [3, 6, 9]])

>>>

矩阵函数：
- dot():做矩阵乘法，一维数组做点积，二维数组做内积，不过乘积必须满足矩阵相乘的形式（M(x,y)*M2(y,z)）,两个矩阵的行列必须对应，都是一维的话必须是一个行向量，一个列向量，可以用m.reshape(-1,1)将行向量转为列向量，或者m.reshape(1,-1)将列向量转为行向量。
- inner():
- outer():
矩阵中更高级的一些运算可以在NumPy的线性代数子库linalg中找到。例如inv函数计算逆矩阵，solve函数可以求解多元一次方程组。

>>> from numpy import linalg as ll

>>> ll.inv(a) #求逆

matrix([[-0.6       ,  0.6       , -0.2       ],

        [-0.2       , -0.8       ,  0.6       ],

        [ 0.66666667,  0.33333333, -0.33333333]])

>>> a

matrix([[1, 2, 3],

        [5, 5, 6],

        [7, 9, 9]])

参考：http://blog.csdn.net/sunny2038/article/details/9002531

参考：http://old.sebug.net/paper/books/scipydoc/numpy_intro.html#id8

[python]-数据科学库Numpy学习的更多相关文章

Matplotlib 使用 - 《Python 数据科学手册》学习笔记
一.引入 import matplotlib as mpl import matplotlib.pyplot as plt 二.配置 1.画图接口 Matplotlib 有两种画图接口: (1)一个是 ...
9 个鲜为人知的 Python 数据科学库
除了 pandas.scikit-learn 和 matplotlib,还要学习一些用 Python 进行数据科学的新技巧. Python 是一种令人惊叹的语言.事实上,它是世界上增长最快的编程语言之 ...
Python数据科学手册-Numpy入门
通过Python有效导入.存储和操作内存数据的技巧数据来源:文档.图像.声音.数值等等,将所有的数据简单的看做数字数组非常有助于理解和处理数据不管数据是何种形式,第一步都是将这些数据转换成 ...
20个最有用的Python数据科学库
核心库与统计 1. NumPy(提交:17911,贡献者:641) 一般我们会将科学领域的库作为清单打头,NumPy 是该领域的主要软件库之一.它旨在处理大型的多维数组和矩阵,并提供了很多高级的数学函 ...
Python 数据科学系列の Numpy、Series 和 DataFrame介绍
本課主題 Numpy 的介绍和操作实战 Series 的介绍和操作实战 DataFrame 的介绍和操作实战 Numpy 的介绍和操作实战 numpy 是 Python 在数据计算领域里很常用的模块 ...
Python数据科学手册-Numpy数组的计算：比较、掩码和布尔逻辑，花哨的索引
Numpy的通用函数可以用来替代循环, 快速实现数组的逐元素的运算同样,使用其他通用函数实现数组的逐元素的比较 < > 这些运算结果是一个布尔数据类型的数组. 有6种标准的比较操作 ...
Python数据科学手册-Numpy的结构化数组
结构化数组和记录数组为复合的.异构的数据提供了非常有效的存储 (一般使用pandas 的 DataFrame来实现) 传入的dtpye 使用 Numpy数据类型 Character Descri ...
Python数据科学手册-Numpy数组的排序
1) Numpy中的快速排序: np.sort 和 np.argsort np.sort 是快速排序,算法复杂度 O[ N log N] ,也可以选择归并排序和堆排序如果不想修改原始输入数组,返 ...
Python数据科学手册-Numpy数组的计算，通用函数
Python的默认实现(CPython)处理某些操作非常慢,因为动态性和解释性, CPython 在每次循环必须左数据类型的检查和函数的调度..在编译是进行这样的操作.就会加快执行速度. 通用函数介绍 ...

随机推荐

[Oracle]LogMiner工具小结
(一)LogMiner工具的作用Logminer工具主要用来分析redo log和archive log文件.通过该工具,可以轻松获得Oracle redo log和archive log文件的具体内 ...
Atom打造 c/c++编译环境（忙了一个上午）
众所周知 Atom是一款非常酷炫的编辑器.因为它就像上古卷轴一样,玩家可以开发各种dlc补丁,实现自己想要的效果.所以Atom 可以被你改造成自己想要的东西,可以用来写算法竞赛题目,可以开发网页,可以 ...
Linux基础（6）
Linux基础(六) shell脚本中的三大循环和函数知识点一.流程控制之if结构 1.简单的if实例: #!/bin/bash var='/etc/init.d' #var='/dev/sda' ...
源于《Unity官方实例教程 “Space Shooter”》思路分析及相应扩展
教程来源于:Unity官方实例教程 Space Shooter(一)-(五) http://www.jianshu.com/p/8cc3a2109d3b 一.经验总结教程中步骤清晰,并且 ...
【Android Widget】FragmentTabHost
android.support.v4包里面提供了FragmentTabHost用来替代TabHost,FragmentTabHost内容页面支持Fragment,下面我们就通过示例来看他的用法效果图 ...
QQ互联第三方登陆 redirect uri is illegal(100010)
想必第一次大家接触QQ第三方登陆都会遇到各种各样的问题,备受折磨,因此,今天我把自己做QQ登陆的过程描述一下,希望给大家提供参考,少走弯路. 在开发之前,我们先了解下QQ登陆的流程第一:查看熟悉网 ...
eclipse中集成hadoop插件
1.下载并安装eclipse2.https://github.com/winghc/hadoop2x-eclipse-plugin3.下载插件到eclipse的插件目录 4.配置hadoop安装目录 ...
转：request.getSession(true)和request.getSession(false)的区别
1.转自:http://wenda.so.com/q/1366414933061950?src=150 概括: request.getSession(true):若存在会话则返回该会话,否则新建一个会 ...
Linux增加磁盘操作
首先,增加磁盘分为4个大步骤:1.插上硬盘:2.分区;3.格式化4.挂载,然后分别说说以上四步的具体事项和注意内容. 1.插上硬盘(本位以虚拟机为例) 新买来一块磁盘,把磁盘插到主板上.虚拟机中操作如 ...
RowSet的使用
ResultSet是使用Jdbc编程的人入门和常用的操作数据库的类,自 JDK1.4开始,易于使用RowSet接口被引入.RowSet 接口扩展了标准java.sql.ResultSet接口.RowS ...

[python]-数据科学库Numpy学习