原创作品,如要转载请注明出处:http://www.cnblogs.com/shrimp-can/p/6590152.html

最近要在device函数中使用curand库生成随机数,查找了下资料,除了NVIDIA官网的介绍外,其他介绍deviceAPI的我没有找到,倒是介绍hostAPI的一大堆,因此简单整理下自己所理解的deviceAPI的使用。

一、简介

curand由两部分组成:host端的库和device端的头文件。

host端的库就像其他的CPU库一样curand.h,随机数可以在设备端生成或者CPU端生成。在设备端生成的时候,对库的调用发生在host端,但是随机数的生成实际上发生在device端,随机数存储在global memory中,用户可以调用kernel直接使用这个随机数,也可以将此随机数拷贝回kernel。

device端的库头文件curand_kernel.h,这个头文件里面定义了设置随机数生成器的状态以及生成一系列随机数的设备函数,使得kernel可以调用函数生成随机数,而不需要从global memory处读写。

二、device API

包含头文件curand_kernel.h,工程需要链接到库curand。

使用curand的deviceAPI生成随机数主要需要三个步骤

a.创建一个随机算法状态的对象,如curandState state

b.对状态进行初始化,使用curand_init()函数

c.生成随机数,使用curand等

deviceAPI的作用也是这些,下面进行更详细的介绍

1.创建随机算法状态对象

在deviceAPI中,有4中为随机算法,4种真随机算法

伪随机算法     对应的状态

Mtgp32                       curandStateMtgp32_t

MRG32k3a                 curandStateMRG32k3a_t

Philox4_32_10           curandStatePhilox4_32_10_t

XORWOW                  curandStateWORWOW_t

真随机算法     对应的状态

scrambled Sobol64     curandStateScrambledSobol64_t

Sobol64                    curandStateSobol64_t

scrambled Sobol32     curandStateScrambledSobol32_t

Sobol32                    curandStateSobol32_t

如要创建算法XORWOW状态对象:curandStateWORWOW_t   state

2.对算法状态进行初始化

curand_init()函数,不同的算法,函数的参数不相同,具体算法所需要的参数可以看NVIDIA官网curand_initAPI:http://docs.nvidia.com/cuda/curand/group__DEVICE.html#group__DEVICE

对于除了MTGP32的伪随机算法,初始化参数都是:种子、序列、偏移、要初始化的随机算法状态对象

注意:算法MTGP32的初始化是通过两个hostAPI,curandMakeMTGP32Constants和cirandMakeMTGP32KernelState

如要初始化算法XORWOW状态对象:curand_init ( unsigned long long seed, unsigned long long subsequence, unsigned long long offset, curandStateXORWOW_t* state )

3.生成随机数

生成随机数除了可以使用不同的算法(由参数决定)以外,还能生成不同分布、不同浮点类型的随机数,这根据调用的生成随机数的API决定。

主要有以下几种API:

curand                                                  生成unsigned int型整数,没有特殊分布

curand_uniform                                    生成服从均匀分布的float

curand_uniform4                                  生成4个服从均匀分布的float

curand_uniform_double                     生成服从均匀分布的double

curand_uniform2_double                     生成2个服从均匀分布的double

curand_poisson                                 生成服从泊松分布的int

curand_poisson4                               生成4个服从泊松分布的int

curand_normal                                  生成服从正态分布的float

curand_normal2                                生成2个服从正态分布的float

curand_normal4                                生成4个服从正态分布的float

curand_normal_double                     生成服从正态分布的double

curand_normal2_double                   生成2个服从正态分布的double

curand_log_normal                           生成服从对数正态分布的float

curand_log_normal2                           生成2个服从对数正态分布的float

curand_log_normal4                           生成4个服从对数正态分布的float

curand_log_normal_double                生成服从对数正态分布的double

curand_log_normal2_double              生成2个服从对数正态分布的double

curand_mtgp32_single                    生成mtgp32算法中服从均匀分布的float

curand_mtgp32_single_specific         生成mtgp32算法中服从特殊泊松分布的float

curand_mtgp32_specific                    生成mtgp32算法中的32bits的int

如要生成一个int型的随机数,采用XORWOW算法:curand(curandStateXORWOW_t* state)

以上是个人理解,如有错误的地方,忘批评指正

urand_mtgp32_single 生成mtgp32算法中服从均匀分布的floa

curand_log_normal2 生成2个服从对数正态分布的float_log_normal 生成服从对数正态分布的floatcurand_log_normal 生成服从对数正态分布的floatcu

curand_log_normal 生成服从对数正态分布的floa

curand_log_normal 生成服从对数正态分布的floacurand_log_normal 生成服从对数正态分布的floacurand_log_normal 生成服从对数正态分布的f

CUDA随机数生成库curand——deviceAPI的更多相关文章

  1. CUDA数学库

    CUDA数学库 高性能数学例程 CUDA数学库是经过行业验证的,高度准确的标准数学函数的集合.只需在源代码中添加" #include math.h",即可用于任何CUDA C或CU ...

  2. cuda npp库旋转图片

    #include <stdio.h> #include <stdlib.h> #include <string.h> #include <assert.h&g ...

  3. NVIDIA GPU上的随机数生成

    NVIDIA GPU上的随机数生成 NVIDIA CUDA随机数生成库(cuRAND)提供高性能的GPU加速的随机数生成(RNG).cuRAND库使用NVIDIA GPU中提供的数百个处理器内核,将质 ...

  4. ubuntu16.04 Detectron目标检测库配置(包含GPU驱动,Cuda,Caffee2等配置梳理)

    Detectron概述 Detectron是Facebook FAIR开源了的一个目标检测(Object Detection)平台. 用一幅图简单说明下Object Detection.如Mask R ...

  5. CUDA基础介绍

    一.GPU简介 1985年8月20日ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年4月ATi发布了Mach32图形卡集成了图形加速功能,1998年4月ATi ...

  6. 第一篇:CUDA 6.0 安装及配置( WIN7 64位 / 英伟达G卡 / VS2010 )

    前言 本文讲解如何在VS 2010开发平台中搭建CUDA开发环境. 当前配置: 系统:WIN7 64位 开发平台:VS 2010 显卡:英伟达G卡 CUDA版本:6.0 若配置不同,请谨慎参考本文. ...

  7. ubuntu16.04+caffe+GPU+cuda+cudnn安装教程

    步骤简述: 1.安装GPU驱动(系统适配,不采取手动安装的方式) 2.安装依赖(cuda依赖库,caffe依赖) 3.安装cuda 4.安装cudnn(只是复制文件加链接,不需要编译安装的过程) 5. ...

  8. [翻译]CURAND Libaray--Host API--(2)

    Translated by xingoo 如果有错误请联系:xinghl90@gmail.com 2.3 返回值 所有的CURAND host端的函数返回值都是curandStatus_t.如果调用没 ...

  9. cuda在ubuntu的安装使用分享

    前言 之前给大家分享过opencv在jetson nano 2gb和ubuntu设备中使用并且展示了一些人脸识别等的小demo.但是对于图像处理,使用gpu加速是很常见 .(以下概念介绍内容来自百科和 ...

随机推荐

  1. [html] 学习笔记--Web存储

    HTML5 提供了两种在客户端存储数据的新方法之前,这些都是由 cookie 完成的.但是 cookie 不适合大量数据的存储,因为它们由每个对服务器的请求来传递,这使得 cookie 速度很慢而且效 ...

  2. UI进阶 即时通讯之XMPP登录、注册

    1.XMPP环境搭建 http://www.cnblogs.com/fearlessyyp/p/5506644.html 第一次打开可能会有点儿慢,图片很多,步骤很详细,祝搭建成功. 2.工程中添加X ...

  3. matlab 利用persistent关键字 存储持久变量

    数学知识:标准差体现随机变量取值与其期望值的偏差.标准差的值较大,则表明该随机变量的取值与其期望值的偏差较大反之,则表明此偏差较小.函数功能:函数必须能够接受一次输入值并记录对应的已输入数N.sum( ...

  4. matlab 利用while循环计算平均值和方差(第二版)

    第一版中因为公式中含有:分母项:n(n-1),而程序并没有对输入数进行判定,如果仅仅输入一个或者一个都不输入,将会出现除0的情况 基于此,进行第二版改进. 代码: % 脚本文件:states.m % ...

  5. 张高兴的 UWP 开发笔记:用 Thumb 控件仿制一个可拖动 Button

    在 WPF 上可用的控件拖动方法在 UWP 上大多没用,那干脆用 Thumb 仿制一个吧. 关于 Thumb 控件的教程也不多,毕竟在 WPF 控件拖动有很多种方法, Thumb 就显得很鸡肋了.下面 ...

  6. TCP报文段的首部格式

    首部20个字节的的固定部分,40个字节的可选部分 (1)源端口和目的端口 (2)序号(是字节流的编号,0-2^32-1),如果超过了mod2^32 (3)确认号:目的主机希望源主机收到的下一个字节序号 ...

  7. 游戏UI框架设计(一) : 架构设计理论篇

    游戏UI框架设计(一) ---架构设计理论篇 前几天(2017年2月)看到一篇文章,国内王健林.马云等大咖们看好的未来十大最有"钱途"产业中,排名第一的就是"泛娱乐&qu ...

  8. 【原创】NuGet 出现“无法初始化 PowerShell 主机,如果将你的 PowerShell 执行策略设置设置为 AllSigned ,请先打开程序包管理控制台以初始化该主机” 错误的解决方法

    现象: 网上的设置 AllSigned 等方法都无效..后来考虑可能跟命令行版本兼容性有关系,然后在注册表命令行配置里发现一 ForceV2 设置项,抱着试一试的心态改了下,果然解决了! 解决方法:修 ...

  9. jQuery插件,将内容插入到光标处

    (function ($) { $.fn.extend({ insertAtCaret : function (myValue) { var $t = $(this)[0]; if (document ...

  10. HTTP笔记(一)

    最近在看<图解HTTP>.全书以图解的形式生动形象的讲解了HTTP协议.本文是根据该书整理的笔记,方便以后回顾. HTTP的诞生 HTTP又称超文本传输协议(HTTP,HyperText ...