【CUDA开发】Cuda C++ Thrust API与 Cuda Runtime API程序比较
今天买了本新书《高性能CUDA应用设计与开发方法与最佳实践》,今天读了第一章有点出获,分享给大家。
程序功能:给向量填充数据并计算各元素之和
1. CPU串行运行的代码:
//seqSerial.cpp:串行执行数组的填充及求和
#include<iostream>
#include<vector>
using namespace std;
int main()
{
const int N=50000;
//任务1:创建数组
vector<int> a(N);
//任务2:填充数组
for(int i=0;i<N;i++)a[i]=i;
//任务3:计算数组各元素之和
int sumA=0;
for(int i=0;i<N;i++)sumA+=a[i];
//任务4:计算0-N-1之和
int sumCheck=0;
for(int i=0;i<N;i++)sumCheck+=i;
//任务5:检查结果是否正确
if(sumA==sumCheck) cout<<"Test Succeeded!"<<endl;
else {cerr<<"TestFailed!"<<endl;return(1);}
return (0);
}
2.Cuda Thrust C++ API 程序
#include<iostream>
using namespace std;
#include<thrust\/reduce.h>
#include<thrust/sequence.h>
#include<thrust/host_vector.h>
#include<thrust/device_vector.h>
int main()
{
const int N=50000;
//任务1:创建数组
thrust::device_vector<int>a(N);
//任务2:填充数组,并行运算
thrust::sequence(a.begin(),a.end(),0);
//任务3:计算数组元素之和,并行计算
int sumA=thrust::reduce(a.begin(),a.end(),0);
//
int sumCheck=0;
for(int i=0;i<N;i++)
sumCheck+=i;
//
if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
else
{
cerr<<"Test Failed!"<<endl;
return(1);
}
getchar();
return (0);
}
3.仅对数据填充改为Runtime API 程序
//使用cuda Runtime API完成向数组中填充连续整数
#include<iostream>
using namespace std;
#include<thrust\/reduce.h>
#include<thrust/sequence.h>
#include<thrust/host_vector.h>
#include<thrust/device_vector.h>
__global__ void fillKernel(int *a,int n)
{
int tid=blockIdx.x*blockDim.x+threadIdx.x;
if(tid<n) a[tid]=tid;
}
void fill(int *d_a,int n)
{
int nThreadsPerBlock=512;
//int nBlocks=n/nThreadsPerBlock+(n%nThreadsPerBlock)?1:0);
int nBlocks=(n+nThreadsPerBlock)/nThreadsPerBlock;
fillKernel<<<nBlocks,nThreadsPerBlock>>>(d_a,n);
}
int main()
{
const int N=50000;
//任务1:创建数组
thrust::device_vector<int>a(N);
//任务2:填充数组,使用Runtime API 填充数组
fill(thrust::raw_pointer_cast(&a[0]),N);
//任务3:计算数组元素之和,并行计算
int sumA=thrust::reduce(a.begin(),a.end(),0);
//任务4:计算0-N-1之和
int sumCheck=0;
for(int i=0;i<N;i++)
sumCheck+=i;
//任务5:检查结果的正确性
if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
else
{
cerr<<"Test Failed!"<<endl;
return(1);
}
getchar();
return (0);
}
【CUDA开发】Cuda C++ Thrust API与 Cuda Runtime API程序比较的更多相关文章
- 【CUDA开发】CUDA面内存拷贝用法总结
[CUDA开发]CUDA面内存拷贝用法总结 标签(空格分隔): [CUDA开发] 主要是在调试CUDA硬解码并用D3D9或者D3D11显示的时候遇到了一些代码,如下所示: CUdeviceptr g_ ...
- 【并行计算-CUDA开发】【视频开发】ffmpeg Nvidia硬件加速总结
2017年5月25日 0. 概述 FFmpeg可通过Nvidia的GPU进行加速,其中高层接口是通过Video Codec SDK来实现GPU资源的调用.Video Codec SDK包含完整的的高性 ...
- 【ARM-Linux开发】【CUDA开发】【深度学习与神经网络】Jetson Tx2安装相关之三
JetPack(Jetson SDK)是一个按需的一体化软件包,捆绑了NVIDIA®Jetson嵌入式平台的开发人员软件.JetPack 3.0包括对Jetson TX2 , Jetson TX1和J ...
- 【CUDA开发】CUDA编程接口(一)------一十八般武器
子曰:工欲善其事,必先利其器.我们要把显卡作为通用并行处理器来做并行算法处理,就得知道CUDA给我提供了什么样的接口,就得了解CUDA作为通用高性能计算平台上的一十八般武器.(如果你想自己开发驱动,自 ...
- 【并行计算与CUDA开发】英伟达硬件加速编解码
硬件加速 并行计算 OpenCL OpenCL API VS SDK 英伟达硬件编解码方案 基于 OpenCL 的 API 自己写一个编解码器 使用 SDK 中的编解码接口 使用编码器对于 OpenC ...
- 【CUDA开发】CUDA从入门到精通
CUDA从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追 ...
- 关于CUDA两种API:Runtime API 和 Driver API
CUDA 眼下有两种不同的 API:Runtime API 和 Driver API,两种 API 各有其适用的范围. 高级API(cuda_runtime.h)是一种C++ ...
- Windows平台CUDA开发之前的准备工作
CUDA是NVIDIA的GPU开发工具,眼下在大规模并行计算领域有着广泛应用. windows平台上面的CUDA开发之前.最好去NVIDIA官网查看说明,然后下载对应的driver. ToolKits ...
- 【神经网络与深度学习】【CUDA开发】caffe-windows win32下的编译尝试
[神经网络与深度学习][CUDA开发]caffe-windows win32下的编译尝试 标签:[神经网络与深度学习] [CUDA开发] 主要是在开发Qt的应用程序时,需要的是有一个使用的库文件也只是 ...
随机推荐
- Visio:为什么按下方向键,选中的目标不动,绘图区(页面)却在移动
造冰箱的大熊猫,本文适用于Microsoft Visio 2007@cnblogs 2018/12/12 检查下键盘的“Scroll Lock”键是不是被激活了(键盘上对应的指示灯被点亮).Scrol ...
- Java多态性详解——父类引用子类对象
来源:http://blog.csdn.net/hikvision_java_gyh/article/details/8957456 面向对象编程有三个特征,即封装.继承和多态. 封装隐藏了类的内部实 ...
- 【BZOJ4671】 异或图
Description 定义两个结点数相同的图 G1 与图 G2 的异或为一个新的图 G, 其中如果 (u, v) 在 G1 与 G2 中的出现次数之和为 1, 那么边 (u, v) 在 G 中, 否 ...
- Ubuntu安装jdk10
一:去官网下载jdk,和jre 因为jdk10之后jdk和jre是分开的 jdk下载 jre下载 二:解压缩,并放到指定目录 # 创建目录 sudo mkdir /usr/lib/java ...
- flask框架(三):flask配置文件
flask中的配置文件是一个flask.config.Config对象(继承字典),默认配置为: { 'DEBUG': get_debug_flag(default=False), 是否开启Debug ...
- #if/#else/#endif
在linux环境下写c代码时会尝试各种方法或调整路径,需要用到#if #include<stdio.h> int main(){ int i; #if 0 i = ; #else i = ...
- PTA 阶乘之和取模
阶乘之和取模 (25 分) 输入正整数n, 计算S = 1!+2!+...+n!的末6位(不含前导0). 这里1<=n<=109. 输入样例: 例如输入: 20 输出样例: 输出: ...
- 3.Linux系统文件名字体不同的颜色都代表什么
在Linux中,文件的颜色都是有含义的.其中, Linux中文件名颜色不同,代表文件类型不一样.如下所示: 白色:表示普通文件浅蓝色:表示链接文件: 灰色:表示其他文件: 绿色:表示可执行文件: 红色 ...
- MySQL_(Java)使用JDBC向数据库中删除(delete)数据
MySQL_(Java)使用JDBC向数据库发起查询请求 传送门 MySQL_(Java)使用JDBC向数据库中插入(insert)数据 传送门 MySQL_(Java)使用JDBC向数据库中删除(d ...
- HTML状态消息和方法
参考链接1 参考链接2 当浏览器从 web 服务器请求服务时,可能会发生错误. HTML消息 1xx: 信息 消息: 描述: 100 Continue 服务器仅接收到部分请求,但是一旦服务器并没有拒绝 ...