Python数据处理——numpy

通过前面两次的学习，基本上对numpy有了一定的认识，所以，接下来进一步对numpy学习。同时，最后以一个有趣的例子加深对numpy的理解。

import numpy as np

xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])

yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])

cond = np.array([True, False, True, True, False])

# 如果cond中的值是T时，选取xarr的值，否则从yarr中选取。这种模式就是：x if condition else y (condition与x相等，就选x，否则y)

result = [(x if c else y)

           for x, y, c in zip(xarr, yarr, cond)]

#print result

'''

上面式子可以用一个函数代替：np.where( , , ,)。第一个参数是一个判定，这个判定的结果是根据后面两个参数来输出的。其中，第二个

是第一个参数的True结果输出，而第三个参数是第一个False结果输出。

'''

result = np.where(cond,xarr,yarr)

#print result

from numpy.random import randn

arr = randn(4,4)

#把大于0的值变成2，小于0的值变成-2

result = np.where(arr > 0, 2, -2)

#print result

#只把大于0的值变成2，其他的不变

result = np.where(arr > 0, 2, arr)

#print result

'''

np.where(rond1 & rond2, 0,

           np.where(rond1, 1,

                      np.where(rond2, 2, 3)))

'''

ax = np.random.randn(5, 4)

#print ax

a = ax[0,:]

#计算每一行的均值使用axis = 1  1代表行

#print ax.mean(axis=1)

#print a.mean()

b = ax[:,0]

#计算每一列的均值使用axis = 0  0代表列

#print ax.mean(axis=0)

#print b.mean()

ay = np.array([[0,1,2],

               [3,4,5],

               [6,7,8]])

#计算每一列前个数与后个数的和，返回的仍是一个数组。     0代表列

#print ay.cumsum(0)

#计算每一行前个数与后个数的积，返回的仍是一个数组。     1代表行

#print ay.cumprod(1)

#计算ax中正数的个数, 布尔值会被强制转为1（True）和 0（False）。

#print ( ax > 0 ).sum()

import numpy as np

a = np.arange(10)

np.save("some_array", a)

b = np.load("some_array.npy")

#print b

#加载txt和逗号分隔文件（CSV）方式。保存用np.savetxt方式

#ab = np.loadtxt("array_ex.txt", delimiter= ",")

#线性代数

#建立一个一维数组由3个1组成。

np.ones(3)

x = np.array([[1,2,3], [4,5,6]])

y = np.array([[6, 23],[-1, 7],[8, 9]])

#计算两个数组的乘积。dot()函数

x.dot(y)

np.dot(x, y)

np.dot(x, np.ones(3))

from numpy.random import randn

from numpy.linalg import inv, qr

X = randn(5, 5)

mat = X.T.dot(X)

#计算数组的逆

inv(mat)

mat.dot(inv(mat))

#计算QR分解

q, r = qr(mat)

#print r

最后，以随机漫步的例子，运用numpy加深对其的理解。

import random

import numpy as np

from numpy.random import randint

b = np.random.randint(0,2)  # numpy中的randint不能取右端的那个值，也就是例子中（0，2）不能取到2

a = random.randint(0,2)     # random中的randint是可以取到右端的值，（0，2）也就是在0，1，2中随机取值

#随机漫步（普通版）

position = 0

walk = [position]

steps = 10

for i in xrange(steps):

    # 这句话实际上是一种逻辑判断句，random.randint是逻辑判断条件，与0比较。标准语句：a if condition else b .判断条件大于0，选择a，反之，选择b。

    step = 1 if random.randint(0,1) else -1

    position += step

    walk.append(position)

#print walk

#随机漫步（提升版）

nsteps = 10

draws = np.random.randint(0,2, size= nsteps)

steps = np.where(draws > 0, 1, -1)

# 将结果变成一种数组

walk = steps.cumsum()

#print walk

#只有数组能这样使用

walk.min()

walk.max()

#判断从0到2步，所需要多久，多少次。

(np.abs(walk) >= 2).argmax()

#多个随机漫步

nwalks = 100

nsteps = 100

draws = np.random.randint(0,2, size=(nwalks, nsteps))

steps = np.where(draws > 0, 1, -1)

#计算每一行的累计和。“1”代表行，“0”代表列

walks = steps.cumsum(1)

walks.min()

walks.max()

#计算大于20或-20的布尔值（True，False）

np.abs(walks) >= 20

#计算每一行中有大于20或-20的布尔值

hits20 = (np.abs(walks) >= 20).any(1)

#计算达到20或-20的行，一共有多少个

hits20.sum()

#计算达到20或-20的行的漫步累计次数

walks[hits20]

#计算达到20或-20的每一行第一次漫步到20或-20的步数

crossing_times = (np.abs(walks[hits20])>= 20).argmax(1)

#计算达到20或-20的每一行第一次漫步到20或-20的步数的均值

print crossing_times.mean()

Python数据处理——numpy_3的更多相关文章

Python数据处理PDF
Python数据处理(高清版)PDF 百度网盘链接:https://pan.baidu.com/s/1h8a5-iUr4mF7cVujgTSGOA 提取码:6fsl 复制这段内容后打开百度网盘手机A ...
Python 数据处理库 pandas 入门教程
Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...
参考《Python数据处理》中英文PDF+源代码
在实际操作中掌握数据处理方法,比较实用.采用基于项目的方法,介绍用Python完成数据获取.数据清洗.数据探索.数据呈现.数据规模化和自动化的过程.主要内容包括:Python基础知识,如何从CSV.E ...
python数据处理技巧二
python数据处理技巧二(掌控时间) 首先简单说下关于时间的介绍其中重点是时间戳的处理,时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00 ...
Python 数据处理之对 list 数据进行数据重排（为连续的数字序号）
Python 数据处理之对 list 数据进行数据重排(为连续的数字序号) # user ID 序号重新排,即,原来是 1,3,4,6 ,排为 1,2,3,4 # item ID 序号重新排,too ...
Python数据处理pdf （中文版带书签）、原书代码、数据集
Python数据处理前言 xiii第1 章 Python 简介 11.1 为什么选择Python 41.2 开始使用Python 41.2.1 Python 版本选择 51.2.2 安装Python ...
Python 数据处理库pandas教程（最后附上pandas_datareader使用实例）
0 简单介绍 pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有 ...
python数据处理书pdf版本|内附网盘链接直接提取|
Python数据处理采用基于项目的方法,介绍用Python完成数据获取.数据清洗.数据探索.数据呈现.数据规模化和自动化的过程.主要内容包括:Python基础知识,如何从CSV.Excel.XML.J ...
最全总结 | 聊聊 Python 数据处理全家桶（Sqlite篇）
1. 前言上篇文章聊到 Python 处理 Mysql 数据库最常见的两种方式,本篇文章继续说另外一种比较常用的数据库:Sqlite Sqlite 是一种嵌入式数据库,数据库就是一个文件,体积很 ...

随机推荐

3409: [Usaco2009 Oct]Barn Echoes 牛棚回声
3409: [Usaco2009 Oct]Barn Echoes 牛棚回声 Time Limit: 3 Sec Memory Limit: 128 MBSubmit: 57 Solved: 47[ ...
[SQL] SQL 基础知识梳理（六）- 函数、谓词、CASE 表达式
SQL 基础知识梳理(六)- 函数.谓词.CASE 表达式目录函数谓词 CASE 表达式一.函数 1.函数:输入某一值得到相应输出结果的功能,输入值称为“参数”,输出值称为“返回值”. 2. ...
Python中类的方法属性与方法属性的动态绑定
最近在学习python,纯粹是自己的兴趣爱好,然而并没有系统地看python编程书籍,觉得上面描述过于繁琐,在网站找了一些学习的网站,发现廖雪峰老师的网站上面的学习资源很不错,而且言简意赅,提取了一些 ...
Eclipse配置Struts2.x
问了我同学现在JavaWeb主流框架是哪些.他说基本框架是SSH,struts2+spring+hibernate,流行的是SSM,springmvc+spring+mybatis,原本计划学下Str ...
Android自学反思总结(上)
从接触Android到现在有几个月的时间了,基本全部都是靠自学,从大一上学期学习完c语言,接着利用寒假时间和开学一个月左右的时间自学完javase,接着在导员的督促下,开始了Android学习之旅,现 ...
爱回收jd图标
http://jd.aihuishou.com/images/icons.png http://misc.360buyimg.com/201007/skin/df/i/bg_hotsale.gif 来 ...
Windows上安装Kafka需要注意的几点
1.不能安装在有空格的路径上比如:D:\Program Files 2.设置日志路径时,要用"/",不能用Windows上的"\",比如: # A comma ...
java实现微信红包分配算法
红包算法分析有人认为,抢红包的额度是从0.01到剩余平均值*N(N是一个系数,决定最大的红包值)之间,比如一共发了10块钱,发了10个红包:第一个人可以拿到(0.01~1*N)之间的一个红包值,当然 ...
CoreCLR源码探索(四) GC内存收集器的内部实现分析篇
在这篇中我将讲述GC Collector内部的实现, 这是CoreCLR中除了JIT以外最复杂部分,下面一些概念目前尚未有公开的文档和书籍讲到. 为了分析这部分我花了一个多月的时间,期间也多次向Cor ...
性能调优案例分享：Mysql的cpu过高
性能调优案例分享:Mysql的cpu过高问题:一个系统,Mysql数据库,数据量变大之后.mysql的cpu占用率很高,一个测试端访问服务器时mysql的cpu占用率为15% ,6个测试端连服务 ...

Python数据处理——numpy_3

Python数据处理——numpy_3的更多相关文章

随机推荐

热门专题