NumPy基础：数组和矢量计算

NumPy的ndarray：一种多维数组对象

该对象是一个快速灵活的大数据集容器。你可以利用这种数组对整块数据执行一些数学运算，其语法跟标量元素之间的运算一样

列表转换为数组

二维列表

数据类型

其他一些自动生成的数组

arange（）

ndarray的数据类型

使用astype（）方法转换类型，如果将浮点数转换成整数，则小数部分将会被截断，如果某个字符串数组全是数字，也可以用其转换为数值形式

数组和标量之间的运算

数组很重要，因为它使你不用编写循环即可对主句执行批量运算。这通常就叫做矢量化。大小相等的数组之间的任何算术运算都会将运算应用到元素级。

数组*数组就是相应位置每个数的乘积，数组也可以和标量进行加减乘除运算。

不同大小的数组之间的运算叫做广播。

基本的索引和切片

跟python中列表类似，数组切片是原始数组的视图。

arr[0][2]

arr[0,2]

这两个是相同的

布尔型索引

可以使用!=,-,或者&,|进行运算。

花式索引

指的是利用整数数组进行索引。

数组转置和轴对称

arr.T,

np.dot(arr.T,arr)计算内积

高位数组的转置不太明白

还有一个swapaxes方法，需要接受一个对轴编号。不太理解

通用函数：快速的元素级数组函数

利用数组进行数据处理

矢量化：用数组表达式代替循环的做法。一般来说，矢量化数组运算要比等价的纯Python方式快上一两个数量级（甚至更多）。

np.neshgrid()函数接受两个一维数组，产生两个二维矩阵（对应于两个数组中所有的（x，y）对）

将条件逻辑表述为数组运算

np.where函数是三元表达式 x if condition else y的矢量化版本。

np.where的第二个和的三个参数不必是数组，他们都可以是标量值。通常用于根据另一个数组而产生一个新的数组。

数学和统计方法

排序

跟Python内置列表类型一样，NumPy数组也可以通过sort方法就地排序。

顶级方法np.sort返回的是数组的已排序副本，而就地排序则会修改数组本身。

唯一化以及其他的集合逻辑

NumPy提供了一些针对一维ndarray的基本集合运算。最常用的可能要数np.unique了，它用于找出数组中的唯一值并返回已排序的结果。

用于数组的文件输入输出

NumPy能够读写磁盘上的文本数据或二进制数据。

将数组以二进制格式保存到磁盘：

np.save() 保存，数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中。

np.load() 读取磁盘上的数组。

np.saves() 可以将多个数组保存到一个压缩文件中，将数组以关键字参数的形式传入即可。.npz

存取文本文件：

np.loadtxt()

np.savetxt()

线性代数

随机数生成

范例：随机漫步

《利用Python进行数据分析》第4章学习笔记的更多相关文章

利用Python进行数据分析第4章 IPython的安装与使用简述
本篇开始,结合前面所学的Python基础,开始进行实战学习.学习书目为<利用Python进行数据分析>韦斯-麦金尼著. 之前跳过本书的前述基础部分(因为跟之前所学的<Python基 ...
利用python进行数据分析－－（阅读笔记一）
以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分 ...
利用Python进行数据分析第7章数据清洗和准备（2）
7.3 字符串操作 pandas加强了Python的字符串和文本处理功能,使得能够对整组数据应用字符串表达式和正则表达式,且能够处理烦人的缺失数据. 7.3.1 字符串对象方法对于许多字符串处理和脚 ...
利用Python进行数据分析第6章数据加载、存储与文件格式（2）
6.2 二进制数据格式实现数据的高效二进制格式存储最简单的办法之一,是使用Python内置的pickle序列化. pandas对象都有一个用于将数据以pickle格式保存到磁盘上的to_pickle ...
利用Python进行数据分析第4章 NumPy基础-数组与向量化计算（3）
4.2 通用函数:快速的元素级数组函数通用函数(即ufunc)是一种对ndarray中的数据执行元素级运算的函数. 1)一元(unary)ufunc,如,sqrt和exp函数 2)二元(unary) ...
利用Python进行数据分析第8章数据规整：聚合、合并和重塑.md
学习时间:2019/11/03 周日晚上23点半开始,计划1110学完学习目标:Page218-249,共32页:目标6天学完(按每页20min.每天1小时/每天3页,需10天) 实际反馈:实际XX ...
利用Python进行数据分析第7章数据清洗和准备（1）
学习时间:2019/10/25 周五晚上22点半开始. 学习目标:Page188-Page217,共30页,目标6天学完,每天5页,预期1029学完. 实际反馈:集中学习1.5小时,学习6页:集中学习 ...
利用Python进行数据分析第5章 pandas入门（2）
5.2 基本功能 (1)重新索引 - 方法reindex 方法reindex是pandas对象地一个重要方法,其作用是:创建一个新对象,它地数据符合新地索引. 如,对下面的Series数据按新索引进行 ...
利用Python进行数据分析第5章 pandas入门（1）
pandas库,含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具.pandas是基于NumPy数组构建. pandas常结合数值计算工具NumPy和SciPy.分析库statsmodels和 ...
《Python自然语言处理》第二章学习笔记
import nltk from nltk.book import * nltk.corpus.gutenberg.fileids() emma = nltk.corpus.gutenberg.wor ...

随机推荐

音痴又音痴的LT
中文题不解释.比赛时想着操作一次sort一次,然而T到死.后来才知道C++内置容器vector这么强大. 内置函数upperbound(查找数组的首地址, 查找数组的尾地址, 待查找元素)为logn复 ...
easy ui 框架
Easy UI 准备工作(搭建) 1.在WebRoot 的目录下创建js 文件夹,在文件夹中倒入一下两个包 Jquery.easyui.min.js jquery.min.js 2.在WebRoot ...
第十周PSP
第十周PSP 工作周期:11.17-11.24 本周PSP: C类型 C内容 S开始时间 ST结束时间 I中断时间 T净时间(分) 文档写随笔(PSP) 16:20min 16:50min 0 ...
小tip:CSS vw让overflow:auto页面滚动条出现时不跳动
原文地址:http://www.zhangxinxu.com/wordpress/?p=4552 一.水平居中布局与滚动条跳动的千年难题当前web届,绝大多数的页面间布局都是水平居中布局,主体定个宽 ...
拓扑排序（topsort）
本文将从以下几个方面介绍拓扑排序: 拓扑排序的定义和前置条件和离散数学中偏序/全序概念的联系典型实现算法解的唯一性问题 Kahn算法基于DFS的算法实际例子取材自以下材料: http://e ...
Flask+Nginx+uWSGI在Ubuntu服务器上的配置
Flask+Nginx+uWSGI在Ubuntu服务器上的配置 Step1 安装系统环境 Ubuntu服务器选择是阿里云的ECS服务,ECS提供单独的内存\CPU\带宽\存储规格可以选择,并且提供合适 ...
【redis】redis 在 windows 下安装使用
1.安装 windows 下 redis 可用客户端 : http://redisdesktop.com/download ; 或在 github 上下载 redis zip 包,解压包到某个目录并在 ...
保护眼睛，把常用软件的背景设置成Dark
每天长时间使用电脑,很多软件的背景都是白色,久看对眼睛不好. 1)Google Chrome,WebDev/看新闻/看邮件/写博客.使用Stylish插件和Global Dark Style,效果相当 ...
SQL查询符合条件的记录的总数
1. select count(*) from table; //统计元组个数 2. select count(列名) from table; //统计一列中值的个数 3. select co ...
2014NOIP前计划
这几天天天刷水题活得很开心,是时候定一个计划了.想着我要在yzy左的吓人的歌声中看书,还是有点.... 大概就分成几类吧数学//你们这群学霸啊搜索图论 dp 贪心其他每个不定具体时间,加油吧 ...

《利用Python进行数据分析》第4章学习笔记