一 numpy模块

NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。

import numpy as np

(1).np.linalg.norm(x)

顾名思义:linalg = linear + algebra,norm则表示范数,首先需要注意的是范数是对向量(或者矩阵)的度量,是一个标量(scalar)

首先help(np.linalg.norm查看文档

norm(x, ord=None, axis=None, keepdims=False)

x表示要度量的向量,ord表示范数的种类

参数 说明 计算方法
默认 二范数 np.sqrt(x1**2+x2**2+....+xn**2)
ord=2 二范数 同上
ord=1 一范数 |x1|+|x2|+...+|xn|
ord=np.inf 无穷范数 max(|xi|)

用于计算向量x的2范数

x = np.array([3,4])
y = np.linalg.norm(x)
print(y)

输出结果为5.0

计算矩阵x的2范数  对矩阵每一个元素求平方和然后开根号

x = np.array([3,4,5],[3,4,5])
y = np.linalg.norm(x)
print(x)

输出结果为10.0

(2).np.log10(x)              #计算以10为底的对数

np.log(x)                       #log下什么都不写默认是自然对数 e为底

x1 = 10
y1 = np.log10(x1)
x2 = np.e
y2 = np.log(x2)
print(y1,y2)

输出结果为1.0 1.0

(3).np.nan_to_num:Replace nan with zero and inf with finite numbers.
      把np.nan(非常小的数字,接近0)用0取代
       np.inf,或者-np.inf(正负无穷大的数字)用有限数替代

np.set_printoptions(precision=8)
x = np.array([np.inf, -np.inf, np.nan, -128, 128])
print(np.nan_to_num(x))

输出结果为[  1.79769313e+308  -1.79769313e+308   0.00000000e+000  -1.28000000e+002
     1.28000000e+002]

(4).numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。
     
numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中。

x1 = np.random.randn(2,4)
print(x1)
x2 = np.random.rand(2,4)
print(x2)

输出结果 

  [[-1.47942602  0.10728309 -1.49062996  1.32908036]
   [ 0.37065869 -0.04594328  0.72822393  0.74898655]]
  [[ 0.54672608  0.0216933   0.04434537  0.65831692]
   [ 0.06332446  0.75230353  0.12993006  0.75911764]]

(5). numpy.random.normal(loc=0.0, scale=1.0, size=None)   正太分布

参数的意义为:

  loc:float 概率分布的均值,对应着整个分布的中心center

  scale:float 概率分布的标准差,对应于分布的宽度,scale越大越矮胖,scale越小,越瘦高

  size:int or tuple of ints  维数

(6).numpy.random.random(size)

random.random()用于生成一个0到1的随机符点数: 0 <= n
< 1.0

(7).numpy.random.uniform(a,b)
       用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果
a <b, 则 b <= n <= a

print random.uniform(10, 20)
print random.uniform(20, 10)
# 18.7356606526
# 12.5798298022

(8).random.randint(a, b)

用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n: a <= n <= b

print random.randint(12, 20)  # 生成的随机数 n: 12 <= n <= 20
print random.randint(20, 20) # 结果永远是20
# print random.randint(20, 10) # 该语句是错误的。下限必须小于上限

(9).random.randrange([start], stop[, step])

从指定范围内,按指定基数递增的集合中 获取一个随机数。如:random.randrange(10, 100, 2),结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数。random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效.

(10).andom.choice(sequence)

从序列中获取一个随机元素。其函数原型为:random.choice(sequence)。参数sequence表示一个有序类型。这里要说明 一下:sequence在python不是一种特定的类型,而是泛指一系列的类型。list, tuple, 字符串都属于sequence。有关sequence可以查看python手册数据模型这一章。下面是使用choice的一些例子:

print random.choice("学习Python")
print random.choice(["JGood", "is", "a", "handsome", "boy"])
print random.choice(("Tuple", "List", "Dict"))

(11).random.shuffle(x[, random])

用于将一个列表中的元素打乱。如:

p = ["Python", "is", "powerful", "simple", "and so on..."]
random.shuffle(p)
print p
# ['powerful', 'simple', 'is', 'Python', 'and so on...']

(12)对ndarray类型使用len函数

len用于获取一个数组的长度,如果是多维数组,则获取数组的行数。

    temp = np.zeros(shape=[10,20])
print(len(temp)) #

(13)np.squeeze(a, axis=None):

从数组的形状中删除单维度条目,即把shape中为1的维度去掉。

    x = np.array([[[0], [1], [2]]])
print(x.shape) #(1, 3, 1)
print(np.squeeze(x).shape) #(3,)
print(np.squeeze(x, axis=(2,)).shape) # (1, 3)

(14).  np.expand_dims(a, axis):

该函数和np.squeeze()正好相反,数组形状扩充一个维度的。

    x = np.array([1,2])
print(x.shape) #(2,)
y = np.expand_dims(x, axis=0)
print(y.shape) #(1, 2)

(15)列向量和行向量,以及秩为1的数组的区别

# -*- coding: utf-8 -*-
"""
Created on Sun Mar 25 20:17:21 2018
    x = np.array([[[0], [1], [2]]])
print(x.shape) #(1, 3, 1)
print(np.squeeze(x).shape) #(3,)
print(np.squeeze(x, axis=(2,)).shape) # (1, 3)

@author: Administrator
""" import numpy as np '''
下面显示了秩为1的数组以及列向量和行向量的使用,以及区别.我们在使用的时候最好不要使用秩为1的数组
并且当我们不确定矩阵或者向量的维数维数时,我们可以使用.reshape(m,n)指定
''' #a为秩为1的数组,我们可以看到转置和本身一致,shape都是(5,)
a = np.random.randn(5)
print(a,a.shape) #[ 0.58371745 0.62467384 0.72225761 -0.32777546 -1.06321595] (5,)
print(a.T,a.T.shape) #[ 0.58371745 0.62467384 0.72225761 -0.32777546 -1.06321595] (5,) r = np.dot(a,a)
print(r,r.shape) #2.49046445333 () r = np.dot(a,a.T)
print(r,r.shape) #2.49046445333 () #a1为5x1的列向量
a1 = np.random.randn(5,1)
print(a1,a1.shape) #[[-0.20126605]
# [-0.08183096]
# [ 0.12709234]
# [ 1.88915869]
# [1.18566033]] (5, 1) #r1 = np.dot(a1,a1) #会报错 shapes (5,1) and (5,1) not aligned: 1 (dim 1) != 5 (dim 0)
#print(r1,r1.shape) r1 = np.dot(a1,a1.T)
print(r1,r1.shape) #[[ 0.04050802 0.01646979 -0.02557937 -0.3802235 -0.23863317]
# [ 0.01646979 0.00669631 -0.01040009 -0.15459166 -0.09702372]
# [-0.02557937 -0.01040009 0.01615246 0.24009759 0.15068834]
# [-0.3802235 -0.15459166 0.24009759 3.56892057 2.23990052]
# [-0.23863317 -0.09702372 0.15068834 2.23990052 1.40579042]] (5, 5) #a2为1x5的行向量
a2 = np.random.randn(1,5)
print(a2,a2.shape) #[ 0.48272148 0.4743339 -0.31309436 2.01153588 -0.58482391] (5,) #r2 = np.dot(a2,a2) #会报错 shapes (1,5) and (,5) not aligned: 5 (dim 5) != 1 (dim 0)
#print(r2,r2.shape) r2= np.dot(a2,a2.T)
print(r2,r2.shape) #[[ 3.81502768]] (1, 1) #由list或者touple转换为的秩为数组,我们最好指定其shape
c = np.array([1,2,3,4])
print(c.shape)      #(4,) c = np.array([1,2,3,4]).reshape(4,1)
print(c.shape)      #(4,1) d = np.array([[1,2,3],[4,5,6]])
print(d.shape)     #(2,3)

参考文献

[1]Python3.1-标准库之Numpy

python在数据处理中常用的模块之numpy的更多相关文章

  1. python在数据处理中常用的模块之matplotlib

    <利用python进行数据分析>读书笔记--第八章 绘图和可视化 python 画子图(add_subplot & subplot)

  2. python中常用的模块二

    一.序列化 指:在我们存储数据的时候,需要对我们的对象进行处理,把对象处理成方便存储和传输的数据格式,这个就是序列化, 不同的序列化结果不同,但目的是一样的,都是为了存储和传输. 一,pickle.可 ...

  3. python中常用的模块一

    一,常用的模块 模块就是我们将装有特定功能的代码进行归类,从代码编写的单位来看我们的程序,从小到大的顺序: 一条代码<语句块,<代码块(函数,类)<模块我们所写的所有py文件都是模块 ...

  4. python中常用的模块的总结

    1. 模块和包 a.定义: 模块用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是.py结尾的python文件.(例如:文件名:test.py,对应的模块名:test) ...

  5. Python中常用的模块

    模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才 ...

  6. Python编程总结之常用三方模块

    1.excel读写 利用python进行excel读写是经常遇到的事情,最常用的excel读写模块必属xlrd和xlwt,前者负责读,后者负责写,配合起来可实现读写. 举例1):使用xlrd读取exc ...

  7. Python运维中常用的_脚本

    前言 file是一个类,使用file('file_name', 'r+')这种方式打开文件,返回一个file对象,以写模式打开文件不存在则会被创建.但是更推荐使用内置函数open()来打开一个文件. ...

  8. 【python】unittest中常用的assert语句

    下面是unittest模块的常用方法: assertEqual(a, b)     a == b assertNotEqual(a, b)     a != b assertTrue(x)     b ...

  9. Python“函数式编程”中常用的函数

    1.map(func,seq[,seq,...]) 对序列中的每个元素应用函数,python2中map()返回的是列表,python3中返回的是迭代器,可以用list()转换成列表.以下例子为pyth ...

随机推荐

  1. Mybatis之执行自定义SQL举例

    本文说明如何使用Mybatis执行我自定义输入的SQL语句. 需要的mybaits文件包括:配置文件(mybatis-config-dao.xml 和 jdbc.properties).接口文件(IS ...

  2. java.lang.Exception: No tests found matching [{ExactMatcher:fDisplayName=fun2], {ExactMatcher:fDisplayName=fun2(cn.itcast.demo2.fun1)], {LeadingIdentifierMatcher:fClassName=cn.itcast.demo2.fun1,fLeadi

    Junit报的错误, 在测试方法前面没有添加注解@Test

  3. 安装zip版mysql

    MySQL安装文件分为两种,一种是msi格式的,一种是zip格式的.如果是msi格式的可以直接点击安装,按照它给出的安装提示进行安装(相信大家的英文可以看懂英文提示),一般MySQL将会安装在C:\P ...

  4. .net core compatibility windows & windows compatible Linux

    Who is this package for? This package is meant for developers that need to port existing .NET Framew ...

  5. delegate--委托

    delegate--委托 (可以把委托看成用来执行方法的一个东西) eg: namespace delegateTest{ delegate double MathsOp(double x); cla ...

  6. 我踩过的Alwayson的坑!

    最近被sql server Alwayson高可用组和读写分离,弄得神魂颠倒,身心俱疲.遇到了下面一些问题,提醒自己也给后来人做些记录. EntityFramework支不支持Alwayson? 起因 ...

  7. 第五十六 css选择器和盒模型

    1.组合选择器 群组选择器 #每个选择为可以位三种基础选择器任意一个,用逗号隔开,控制多个. div,#div,.div{ color:red } 后代(子代)选择器 .sup .sub{ 后代 } ...

  8. P1880 [NOI1995]石子合并 区间dp+拆环成链

    思路 :一道经典的区间dp  唯一不同的时候 终点和起点相连  所以要拆环成链  只需要把1-n的数组在n+1-2*n复制一遍就行了 #include<bits/stdc++.h> usi ...

  9. 洛谷P2055假期的宿舍

    题目 此题主要是考察二分图匹配,而二分图匹配最主要的就是建图,而图一般都是要分成两个部分来分,比如该题就需要先将在学校住的人和床连在一起,因为在学校住就会与一个床.然后每两个人之间假如他们相互认识就可 ...

  10. 【XSY2612】Comb Avoiding Trees 生成函数 多项式求逆 矩阵快速幂

    题目大意 本题的满二叉树定义为:不存在只有一个儿子的节点的二叉树. 定义一棵满二叉树\(A\)包含满二叉树\(B\)当且经当\(A\)可以通过下列三种操作变成\(B\): 把一个节点的两个儿子同时删掉 ...