CUDA版本的OpenCL在windows 7的下编程初步

参考文献：

http://blog.csdn.net/neoxmu/article/details/8866928

我安装的是CUDA5.5,代码如下：

//#include "stdafx.h"

#include "CL\cl.h"

#include <stdlib.h>

#include <stdio.h>

#pragma comment(lib,"OpenCL.lib")

#define CL_VERBOSE

void openclRetTackle(cl_int retValue, char* processInfo){

	if(retValue!=CL_SUCCESS){

#if (defined CL_DEBUG) || (defined CL_VERBOSE)

		printf("%s Error!\n",processInfo);

#endif

		exit(-1);

	}else{

#ifdef CL_VERBOSE

		printf("%s Success!\n",processInfo);

#endif

	}

}

cl_platform_id cpPlatform;

cl_device_id cdDevice;

cl_context cxGPUContext;

cl_command_queue cqCommandQueue;

int openclInit()

{

	cl_int ret;

	//得到平台ID

	openclRetTackle( clGetPlatformIDs(1, &cpPlatform, NULL), "clGetPlatFormIDs");

	//得到GPU设备ID

	openclRetTackle( clGetDeviceIDs(cpPlatform, CL_DEVICE_TYPE_GPU,1,&cdDevice,NULL), "clGetDeviceIDs");

	//获取GPU设备上下文

	cxGPUContext = clCreateContext(0, 1, &cdDevice, NULL, NULL, &ret);

	openclRetTackle( ret , "clCreateContext" );

	//开辟任务队列

	cqCommandQueue = clCreateCommandQueue(cxGPUContext, cdDevice, 0, &ret);

	openclRetTackle( ret , "clCreateCommandQueue");

	return CL_SUCCESS;

}

int run()

{

	openclInit();

	system("pause");

	return 0;

}

<span style="font-family:Microsoft YaHei;font-size:18px;">//#include "stdafx.h"

#include <stdio.h>

#include <vector>

#include <CL/cl.h>

#include <iostream>

#include <fstream>

#include <string>

#pragma comment(lib,"OpenCL.lib")

int print_device()

{

	cl_int err;

	cl_uint num;

	err = clGetPlatformIDs(0, 0, &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platforms\n";

		return 0;

	}

	std::vector<cl_platform_id> platforms(num);

	err = clGetPlatformIDs(num, &platforms[0], &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platform ID\n";

		return 0;

	}

	cl_context_properties prop[] = { CL_CONTEXT_PLATFORM, reinterpret_cast<cl_context_properties>(platforms[0]), 0 };

	cl_context context = clCreateContextFromType(prop, CL_DEVICE_TYPE_DEFAULT, NULL, NULL, NULL);

	if(context == 0)

	{

		std::cerr << "Can't create OpenCL context\n";

		return 0;

	}

	size_t cb;

	clGetContextInfo(context, CL_CONTEXT_DEVICES, 0, NULL, &cb);

	std::vector<cl_device_id> devices(cb / sizeof(cl_device_id));

	clGetContextInfo(context, CL_CONTEXT_DEVICES, cb, &devices[0], 0);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, 0, NULL, &cb);

	std::string devname;

	devname.resize(cb);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, cb, &devname[0], 0);

	std::cout << "Device: " << devname.c_str() << "\n";

	clReleaseContext(context);

	return 0;

}

cl_program load_program(cl_context context, const char* filename)

{

	std::ifstream in(filename, std::ios_base::binary);

	if(!in.good())

	{

		return 0;

	}// get file length

	in.seekg(0, std::ios_base::end);

	size_t length = in.tellg();

	in.seekg(0, std::ios_base::beg);

	// read program source

	std::vector<char> data(length + 1);

	in.read(&data[0], length);

	data[length] = 0;

	// create and build program

	const char* source = &data[0];

	cl_program program = clCreateProgramWithSource(context, 1, &source, 0, 0);

	if(program == 0)

	{

		return 0;

	}

	if(clBuildProgram(program, 0, 0, 0, 0, 0) != CL_SUCCESS)

	{

		return 0;

	}

	return program;

}

int main()

{

	print_device();

	cl_int err;

	cl_uint num;

	err = clGetPlatformIDs(0, 0, &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platforms\n";

		return 0;

	}

	std::vector<cl_platform_id> platforms(num);

	err = clGetPlatformIDs(num, &platforms[0], &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platform ID\n";

		return 0;

	}

	cl_context_properties prop[] = { CL_CONTEXT_PLATFORM, reinterpret_cast<cl_context_properties>(platforms[0]), 0 };

	cl_context context = clCreateContextFromType(prop, CL_DEVICE_TYPE_DEFAULT, NULL, NULL, NULL);

	if(context == 0)

	{

		std::cerr << "Can't create OpenCL context\n";

		return 0;

	}

	size_t cb;

	clGetContextInfo(context, CL_CONTEXT_DEVICES, 0, NULL, &cb);

	std::vector<cl_device_id> devices(cb / sizeof(cl_device_id));

	clGetContextInfo(context, CL_CONTEXT_DEVICES, cb, &devices[0], 0);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, 0, NULL, &cb);

	std::string devname;

	devname.resize(cb);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, cb, &devname[0], 0);

	std::cout << "Device: " << devname.c_str() << "\n";

	cl_command_queue queue = clCreateCommandQueue(context, devices[0], 0, 0);

	if(queue == 0)

	{

		std::cerr << "Can't create command queue\n";

		clReleaseContext(context);

		return 0;

	}

	const int DATA_SIZE = 1048576;

	std::vector<float> a(DATA_SIZE), b(DATA_SIZE), res(DATA_SIZE);

	for(int i = 0; i < DATA_SIZE; i++)

	{

		a[i] = std::rand();

		b[i] = std::rand();

	}

	cl_mem cl_a = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_float) * DATA_SIZE, &a[0], NULL);

	cl_mem cl_b = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_float) * DATA_SIZE, &b[0], NULL);

	cl_mem cl_res = clCreateBuffer(context, CL_MEM_WRITE_ONLY, sizeof(cl_float) * DATA_SIZE, NULL, NULL);

	if(cl_a == 0 || cl_b == 0 || cl_res == 0)

	{

		std::cerr << "Can't create OpenCL buffer\n";

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	cl_program program = load_program(context, "..\\shader.txt");

	if(program == 0)

	{

		std::cerr << "Can't load or build program\n";

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	cl_kernel adder = clCreateKernel(program, "adder", 0);

	if(adder == 0)

	{

		std::cerr << "Can't load kernel\n";

		clReleaseProgram(program);

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	clSetKernelArg(adder, 0, sizeof(cl_mem), &cl_a);

	clSetKernelArg(adder, 1, sizeof(cl_mem), &cl_b);

	clSetKernelArg(adder, 2, sizeof(cl_mem), &cl_res);

	size_t work_size = DATA_SIZE;

	err = clEnqueueNDRangeKernel(queue, adder, 1, 0, &work_size, 0, 0, 0, 0);

	if(err == CL_SUCCESS)

	{

		err = clEnqueueReadBuffer(queue, cl_res, CL_TRUE, 0, sizeof(float) * DATA_SIZE, &res[0], 0, 0, 0);

	}

	if(err == CL_SUCCESS)

	{

		bool correct = true;

		for(int i = 0; i < DATA_SIZE; i++)

		{

			if(a[i] + b[i] != res[i])

			{

				correct = false;

				break;

			}

		}

		if(correct)

		{

			std::cout << "Data is correct\n";

		}

		else

		{

			std::cout << "Data is incorrect\n";

		}

	}

	else

	{

		std::cerr << "Can't run kernel or read back data\n";

	}

	clReleaseKernel(adder);

	clReleaseProgram(program);

	clReleaseMemObject(cl_a);

	clReleaseMemObject(cl_b);

	clReleaseMemObject(cl_res);

	clReleaseCommandQueue(queue);

	clReleaseContext(context);

	return 0;

}</span>

需要使用的数据：

shader.txt

<span style="font-family:Microsoft YaHei;font-size:18px;">__kernel void adder(__global const float* a, __global const float* b, __global float* result)

{

    int idx = get_global_id(0);

    result[idx] = a[idx] + b[idx];

}</span>

CUDA版本的OpenCL在windows 7的下编程初步的更多相关文章

windows下安装python、环境设置、多python版本的切换、pyserial与多版本python安装、windows命令行下切换目录
1.windows下安装python 官网下载安装即可 2.安装后的环境设置我的电脑--属性--高级--设置path的地方添加python安装目录,如C:\Python27;C:\Python33 ...
YOLOv4：目标检测（windows和Linux下Darknet 版本）实施
YOLOv4:目标检测(windows和Linux下Darknet 版本)实施 YOLOv4 - Neural Networks for Object Detection (Windows and L ...
cmake编译opencv时指定cuda版本
之前有网友提问说,基于cmake编译时如果切换cuda版本,比如我同时装了cuda8和cuda9,opencv总是找到cuda9,我想用cuda8怎么办?实际上,手头上要配置的工程是基于opencv3 ...
如何解决pytorch 编译时CUDA版本与运行时CUDA版本不对应
转载请注明: 仰望高端玩家的小清新 http://www.cnblogs.com/luruiyuan/ 如何解决pytorch 编译时CUDA版本与运行时CUDA版本不对应如果pytorch的编译时 ...
cuda 版本查阅
查看cuda版本 cat /usr/local/cuda/version.txt nvcc -V
[AI] 切换cuda版本的万金油
1. 环境 ubuntu16.04 GTX1080Ti x 4 nvidia-418 cuda-10.1 pytorch1.0.0 目标:在最新的显卡驱动下,使用不同版本的cuda和深度学习框架来执行 ...
pytorch Model Linear实现线性回归CUDA版本
实验代码 import torch import torch.nn as nn #y = wx + b class MyModel(nn.Module): def __init__(self): su ...
矩池云里查看cuda版本
可以用下面的命令查看 cat /usr/local/cuda/version.txt 如果想用nvcc来查看可以用下面的命令 nvcc -V 如果环境内没有nvcc可以安装一下,教程是矩池云上如何安装 ...
矩池云上如何修改cuda版本
cuda版本可能对系统,驱动版本会有影响,修改之前需要先进行确认 1.检查系统版本 source /etc/os-release && echo $VERSION_ID 2.导入apt ...

随机推荐

理解 Linux 的硬链接与软链接
Linux 的文件与目录现代操作系统为解决信息能独立于进程之外被长期存储引入了文件,文件作为进程创建信息的逻辑单元可被多个进程并发使用.在 UNIX 系统中,操作系统为磁盘上的文本与图像.鼠标与键盘 ...
java虚拟机 jvm 局部变量表实战
java局部变量表是栈帧重要组中部分之一.他主要保存函数的参数以及局部的变量信息.局部变量表中的变量作用域是当前调用的函数.函数调用结束后,随着函数栈帧的销毁.局部变量表也会随之销毁,释放空间. 由于 ...
关于Lt分发系统的时序图分析
我们已经知道,系统共分为两个模块,mather与son 同时系统允许的操作也有三种,向mather提交war包,我某个服务器更新代码,为所有服务器更新代码我们一个一个来看先说,向mather提交w ...
Spring开发环境搭建教程
Spring开发环境搭建 JDK7以上版本 eclispe for j2ee 4.0以上版本 Spring frameWorks 3.0以上版本至于前两个我们就不介绍,直接百度就可以了,对于Spri ...
从嵌入式linux到android应用开发
时间过得很快,转眼之间已经到新公司一个月了.虽然学到了一些移动开发的知识,但是觉得离我的目标还很远,完全没能达到我想要的水平.以前产品都是自己主导的,需要完成什么,计划什么也是自己主导,现在得从头 ...
Fragment的事务操作&Actvity的状态丢失
Fragment Transactions & Activity State Loss 本文翻译自Fragment Transactions & Activity State Loss ...
C++对象模型的那些事儿之五：NRV优化和初始化列表
前言在C++对象模型的那些事儿之四:拷贝构造函数中提到如果将一个对象作为函数参数或者返回值的时候,会调用拷贝构造函数,编译器是如何处理这些步骤,又会对其做哪些优化呢?本篇博客就为他家介绍一个编译器的 ...
简单RPC实现之Netty实现
所谓RPC就是远程方法调用(Remote Process Call ),简单的来说就是通过MQ,TCP,HTTP或者自己写的网络协议来传输我要调用对方的什么接口,对方处理之后再把结果返回给我.就这么 ...
探索Antlr（Antlr 3.0更新版）
版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://www.blogbus.com/dreamhead-logs/10756716.html <探索Antlr> ...
Bootstrap简单HelloWorld入门教程
这篇教程旨在让你在20分钟内学会使用twitter bootstrap创建一个站点.看完这个教程后你应该能够使用bootstrap来建立一个基本的响应式布局的页面,了解栅格系统,并且能够使用boots ...

CUDA版本的OpenCL在windows 7的下编程初步

CUDA版本的OpenCL在windows 7的下编程初步的更多相关文章

随机推荐

热门专题