技术背景

随机采样问题，不仅仅只是一个统计学/离散数学上的概念，其实在工业领域也都有非常重要的应用价值/潜在应用价值，具体应用场景我们这里就不做赘述。本文重点在于在不同平台上的采样速率，至于另外一个重要的参数检验速率，这里我们先不做评估。因为在Jax中直接支持vmap的操作，而numpy的原生函数大多也支持了向量化的运算，两者更像是同一种算法的不同实现。所以对于检验的场景，两者的速度区别更多的也是在硬件平台上。

随机采样示例

关于Jax的安装和基本使用方法，读者可以自行参考Jax的官方文档，需要注意的是，Jax有CPU、GPU和TPU三个版本，如果需要使用其GPU版本的功能，还需要依赖于jaxlib，另外最好是指定安装对应的CUDA版本，这都是安装过程中所踩过的一些坑。最后如果安装的不是GPU的版本，运行Jax脚本的时候会有相关的提示说明。

随机采样，可以是针对一个给定的连续函数，也可以针对一个离散化的列表，但是为了更好的扩展性，一般问题都会转化成先获取均匀的随机分布，再转化成其他函数形式的分布，如正态分布等。所以这里我们更加的是关注下均匀分布函数的效率：

import numpy as np

import time

import jax.random as random

key = random.PRNGKey(0)

print ('An small example of numpy sampler: \n{}'.format(np.random.uniform(low=0,high=1,size=5)))

print ('An small example of jax sampler: \n{}'.format(random.uniform(key,shape=(5,),minval=0, maxval=1)))

data_size = 400000000

time0 = time.time()

s = np.random.uniform(low=0,high=1,size=data_size)

print ('The numpy time cost is: {}s'.format(time.time()-time0))

time1 = time.time()

v = random.uniform(key,shape=(data_size,),minval=0, maxval=1)

print ('The jax time cost is: {}s'.format(time.time()-time1))

执行结果如下：

An small example of numpy sampler:

[0.33654613 0.20267496 0.86859762 0.14940831 0.30321738]

An small example of jax sampler:

[0.57450044 0.09968603 0.39316022 0.8941783  0.59656656]

The numpy time cost is: 3.6664984226226807s

The jax time cost is: 0.10985755920410156s

同样是在生成双精度浮点数的情况下，我们可预期的GPU的速率在数据长度足够大的情况下一定是会更快的，这个运算结果也佐证了这个说法。

总结概要

关于工业领域中可能使用到的随机采样，更多的是这样的一个场景：给定一个连续或者离散的分布，然后进行大规模的连续采样，采样的同时需要对每一个得到的样点进行分析打分，最终在这大规模的采样过程中，有可能被使用到的样品可能只有其中的几份。那么这样的一个抽象问题，就非常适合使用分布式的多GPU硬件架构来实现。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/sampler.html

作者ID：DechinPhy

更多原著文章请参考：https://www.cnblogs.com/dechinphy/

打赏专用链接：https://www.cnblogs.com/dechinphy/gallery/image/379634.html

腾讯云专栏同步：https://cloud.tencent.com/developer/column/91958

GPU随机采样速度比较的更多相关文章

关于乱序（shuffle）与随机采样（sample）的一点探究
最近一个月的时间,基本上都在加班加点的写业务,在写代码的时候,也遇到了一个有趣的问题,值得记录一下. 简单来说,需求是从一个字典(python dict)中随机选出K个满足条件的key.代码如下(py ...
随机采样和随机模拟：吉布斯采样Gibbs Sampling实现高斯分布参数推断
http://blog.csdn.net/pipisorry/article/details/51539739 吉布斯采样的实现问题本文主要说明如何通过吉布斯采样来采样截断多维高斯分布的参数(已知一 ...
随机采样和随机模拟：吉布斯采样Gibbs Sampling实现文档分类
http://blog.csdn.net/pipisorry/article/details/51525308 吉布斯采样的实现问题本文主要说明如何通过吉布斯采样进行文档分类(聚类),当然更复杂的实 ...
Pandas排列和随机采样
随机重排序 import pandas as pd import numpy as np from pandas import Series df = pd.DataFrame(np.arange(5 ...
hive随机采样
hive> select * from account limit 10;OKaccount.accountname account.accid account.platid ac ...
使用 numpy.random.choice随机采样
使用 numpy.random.choice随机采样: 说明: numpy.random.choice(a, size=None, replace=True, p=None) 示例: >> ...
利用shuf对数据记录进行随机采样
最近在用SVM为分类器做实验,但是发现数据量太大(2000k条记录)但是训练时间过长...让我足足等了1天的啊!有人指导说可以先进行一下随机采样,再训练,这样对训练结果不会有太大影响(这个待考证).所 ...
Pandas随机采样
实现对DataFrame对象随机采样 pandas是基于numpy建立起来的,所以numpy大部分函数可作用于DataFrame和Series数据结构. numpy.random.permutatio ...
YOLO---Darknet下的 GPU vs CPU 速度
YOLO---Darknet下的 GPU vs CPU 速度目录一.基础环境二.安装Darknet-yolo v3 三.CPU下测试四.GPU下测试五.测试速度对比结论正文一.基础环境 ...

随机推荐

C#笔记1__命名空间 / 常量 / object / is、as、...?... ：...
命名空间:namespace Test1{ ... } 引用命名空间:using System; using 别名=命名空间常量:const double PI=3.14; using System ...
zabbix部署文档
环境:zabbix server centos 7 1611最小化安装 172.16.103.2 zabbix client Centos 7 1611 最小化安装 172.16.103.3 1,配置 ...
测试平台系列(71) Python定时任务方案
大家好~我是米洛! 我正在从0到1打造一个开源的接口测试平台, 也在编写一套与之对应的完整教程,希望大家多多支持. 欢迎关注我的公众号测试开发坑货,获取最新文章教程! 定时任务定时任务,顾名思义: ...
Swift进阶-内存管理
本文的主要目的是探索 RefCount 的内存结构及强/弱引用计数管理 Swift 中也是采用 ARC 编译器自动内存管理机制. Swift 对象的内存结构是 HeapObject, 有两个属性 Me ...
Java不同时区(timezone)之间时间转换
最近出现一个问题是这样的:我们的系统在国外打印的日志时间由于时差关系和国内不一致,看起来不方便,希望国外的日志和国内保持一致,即:需要对不同时区的时间做转换调整,统一为国内时间. 一.关于时区的一些概 ...
Redis INFO CPU 信息详解
一.INFO CPU 通过INFO CPU命令可以查看Redis进程对于CPU的使用情况,如下: 这几个字段的含义如下所示: used_cpu_sys: System CPU consumed by ...
一个疏忽损失惨重！就因为把int改成Integer，第2天被辞了
1 故事背景一个程序员就因为改了生产环境上的一个方法参数,把int型改成了Integer类型,因为涉及到钱,结果上线之后公司损失惨重,程序员被辞退了.信不信继续往下看.先来看一段代码: public ...
事件消息生产消费中间件-OSS.DataFlow
系统重构解耦的过程涉及不同领域服务分拆,或同一服务下实时响应部分和非响应部分分拆,分解后的各部分通过异步消息的流转传递,完成整体的业务逻辑,但是频繁的在业务层面直接调用不同消息队列的SDK,个人感觉不 ...
Linux之间的文件传输方式
大数据集群经常涉及文件拷贝,我在学习大数据时总结了几种方式三台主机:192.168.10.100.192.168.10.101.192.168.10.102有一个一样的用户:swcode 做过映射关 ...
psutil模块详解
import psutil#1.系统性能信息模块psutilmem = psutil.virtual_memory()print(mem)#svmem(total=8442675200, availa ...