矢量化

矢量化是指用数组表达式替换显式的for循环，在Python中循环数组或其他跟数组类似的数据结构时，使用循环会涉及很多开销。NumPy中的矢量化操作把内部循环委托给高度优化的C和Fortran函数，从而实现更清晰，更快速的Python代码。

矢量化是NumPy中的一种强大功能，可以把操作表达为“在整个数组上而不是在各个元素上”发生，Python内部隐式对数组的各个元素执行相同的操作。

矢量化对每个元素执行相同的操作，对于原生的Python代码，举一个简单的例子，考虑将1维数组中的每个元素与相同长度的另一个序列中的相应元素相乘的情况。如果数据存储在两个Python 列表 a 和 b 中，我们可以迭代每个元素，如下所示：

c = []

for i in range(len(a)):

    c.append(a[i]*b[i])

当涉及到 ndarray 时，逐个元素的操作是“默认模式”：

c = a * b

广播

两个形状相同的NumPy数组之间的操作是按元素操作的，对于大小不同的数组，按照广播规则来进行。广播（Broadcasting）描述了 numpy 如何在算术运算期间处理具有不同形状的数组。

1，广播的原理

NumPy 通常在数组的每个元素上执行相同的操作，在最简单的情况下，两个数组具有完全相同的形状，如下例所示，a和b都是数组，对数组执行相乘操作，Python内部执行的操作是对位置相同的元素执行相乘操作：

>>> a = np.array([1.0, 2.0, 3.0])

>>> b = np.array([2.0, 2.0, 2.0])

>>> a * b

array([ 2.,  4.,  6.])

当数组的形状满足某些约束时，NumPy的广播规则放宽了这种约束。当一个数组和一个标量值在一个操作中组合时，会发生最简单的广播示例，a是数组，b是标量：

>>> a = np.array([1.0, 2.0, 3.0])

>>> b = 2.0

>>> a * b

array([ 2.,  4.,  6.])

结果等同于前面的示例，在算术运算期间，想象b是被拉伸成跟数组a的形状相同的数组，数组b的每个元素都是2.0。

拉伸类比只是概念性的，NumPy足够聪明，可以使用原始标量值而无需实际构造数组。

2，广播规则

为了进行广播，在操作中两个阵列的末尾维度的尺寸必须相同，或者必须有一个维度的尺寸是相同的。

举个例子，数据a的shape是(4,3)，数组b的shape是(1,3)，两个数组的末尾维度是2，形状是兼容的：

技术细节：较小的数组会在较大的数组中“广播”，以便它们具有兼容的形状。

广播规则：广播使用以下2个规则处理具有不同形状的两个数组：

让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。
当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值，也就是说，在任何一个维度上，如果一个数组的维度为1，另一个数组的维度大于1，那么在该维度上，就好像是对第一个数组进行了复制。

简单理解：对两个数组，分别比较它们的每一个维度（若其中一个数组没有当前维度则忽略），满足以下三个条件：

数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。

若条件不满足，抛出 "ValueError: frames are not aligned" 异常。

参考文档：

NumPy 矢量化

NumPy 广播

Array Broadcasting in Numpy

NumPy 学习第三篇：矢量化和广播的更多相关文章

NumPy学习笔记三股票价格
NumPy学习笔记三股票价格 <NumPy学习笔记>系列将记录学习NumPy过程中的动手笔记,前期的参考书是<Python数据分析基础教程 NumPy学习指南>第二版.&l ...
NumPy 学习第四篇：数组的基本操作
在数组中,用axis(轴)表示维度,对于三维数组,axis参数的取值通常有: 当axis=None时,表示把数组展开为一维数组: 当axis=0时,表示按照行(第一维)进行计算: 当axis=1时,表 ...
Deep Learning 2_深度学习UFLDL教程：矢量化编程（斯坦福大学深度学习教程）
1前言本节主要是让人用矢量化编程代替效率比较低的for循环. 在前一节的Sparse Autoencoder练习中已经实现了矢量化编程,所以与前一节的区别只在于本节训练集是用MINIST数据集,而上 ...
从.Net到Java学习第三篇——spring boot+mybatis+mysql
从.Net到Java学习第一篇——开篇环境:mysql5.7 新建mysql数据库demo,然后执行如下sql脚本进行数据表创建和数据初始化: -- ------------------------ ...
[dart学习]第三篇：dart变量介绍（二）
本篇继续介绍dart变量类型,可参考前文:第二篇:dart变量介绍 (一) (一)final和const类型如果你不打算修改一个变量的值,那么就把它定义为final或const类型.其中:final ...
Android基础学习第三篇—Intent的用法
写在前面的话: 1. 最近在自学Android,也是边看书边写一些Demo,由于知识点越来越多,脑子越来越记不清楚,所以打算写成读书笔记,供以后查看,也算是把自己学到所理解的东西写出来,献丑,如有不对 ...
Java学习第三篇:类的三大特征，抽象类，接口，final关键字
一.类的三大特征 1.封装性 (1).什么是封装封装就是把抽象出的数据和对数据的操作封装在一起, 数据被保护在内部, 程序的其他部分只有通过被授权的操作(成员方法), 才能对数据进行操作. (2). ...
单用户模式与救援模式：linux学习第三篇
单用户模式 1. 重新启动,在下列界面选项第一项按 e 按e后进入此grub界面(启动工具) 2. 找到linux16所在行,将'ro'(只读)修改为'rw'(读写),并加上 in ...
R语言学习第三篇：数据框
数据框(data.frame)是最常用的数据结构,用于存储二维表(即关系表)的数据,每一列存储的数据类型必须相同,不同数据列的数据类型可以相同,也可以不同,但是每列的行数(长度)必须相同.数据框的每列 ...

随机推荐

『题解』Codeforces1142A The Beatles
更好的阅读体验 Portal Portal1: Codeforces Portal2: Luogu Description Recently a Golden Circle of Beetlovers ...
『题解』洛谷P4016 负载平衡问题
title: categories: tags: - mathjax: true --- Problem Portal Portal1:Luogu Portal2: LibreOJ Descripti ...
C#索引器与数组的区别
1.索引器的索引值类型不限定为整数 2.索引器允许重载 3.索引器不是一个变量 4.索引器以函数签名方式this标识,而属性采用名称来标识,名称可以任意 5.索引器不能使用static来进行声明,属性 ...
创建OData Service（基于ASP.NET 4.6.1, EF 6），Part I：Project initialize
由于ASP.NET Core 1处于RC阶段,加上OData WebAPI 对ASP.NET Core 1的跟进不是很积极,基于ASP.NET Core 1的Alpha 1版本已经N月没有check ...
MyBatis批量插入模板
oracle: <insert id="insertBatch" parameterType="List"> INSERT INTO TStuden ...
SqlServer2005 查询第一讲计算列
数据库查询[最重要且在数据库中难度最大] 声明一下我这里用的数据库样例是郝斌老师的(scott库) 我尽最大努力把复杂的问题简单化,方便理解,希望我写的东西能够帮助到你们有些复杂的东西我我用自己的方 ...
C# Web分页功能实现
无论是网站还是APP分页功能都是必不可少的.为什么使用分页呢? 1,加载速度快,不会占用服务器太多资源,减少服务器压力. 2,减少数据库压力. 3,提升用户体验. 那么我们常用的分页方法有两种. 1, ...
Flsk&pyecharts 动态数据可视化
1:数据源 Hollywood Movie Dataset: 好莱坞2006-2011数据集实验目的: 实现统计2006-2011的数据综合统计情况,进行数据可视化 gitee地址: https ...
expect 自动填充密码
它的脚本以#!/usr/bin/expect开头,执行时用expoct,而不是bash.我的一个给samba自动创建用户并且自动填写默认密码的脚本如下: vim smb_passwd.exp #!/u ...
管道 |、|&、tee
用“|”或“|&”隔开两个命令之间形成一个管道,左边命令的标准输出(|)或者标准错误输出(|&)信息流入到右边命令的标准输入,即左边命令的标准输出作为右边命令的标准输入.如: make ...

NumPy 学习 第三篇：矢量化和广播

矢量化

广播

NumPy 学习 第三篇：矢量化和广播的更多相关文章

随机推荐

热门专题

NumPy 学习第三篇：矢量化和广播

NumPy 学习第三篇：矢量化和广播的更多相关文章