CUDA版本的OpenCL在windows 7的下编程初步

参考文献：

http://blog.csdn.net/neoxmu/article/details/8866928

我安装的是CUDA5.5,代码如下：

//#include "stdafx.h"

#include "CL\cl.h"

#include <stdlib.h>

#include <stdio.h>

#pragma comment(lib,"OpenCL.lib")

#define CL_VERBOSE

void openclRetTackle(cl_int retValue, char* processInfo){

	if(retValue!=CL_SUCCESS){

#if (defined CL_DEBUG) || (defined CL_VERBOSE)

		printf("%s Error!\n",processInfo);

#endif

		exit(-1);

	}else{

#ifdef CL_VERBOSE

		printf("%s Success!\n",processInfo);

#endif

	}

}

cl_platform_id cpPlatform;

cl_device_id cdDevice;

cl_context cxGPUContext;

cl_command_queue cqCommandQueue;

int openclInit()

{

	cl_int ret;

	//得到平台ID

	openclRetTackle( clGetPlatformIDs(1, &cpPlatform, NULL), "clGetPlatFormIDs");

	//得到GPU设备ID

	openclRetTackle( clGetDeviceIDs(cpPlatform, CL_DEVICE_TYPE_GPU,1,&cdDevice,NULL), "clGetDeviceIDs");

	//获取GPU设备上下文

	cxGPUContext = clCreateContext(0, 1, &cdDevice, NULL, NULL, &ret);

	openclRetTackle( ret , "clCreateContext" );

	//开辟任务队列

	cqCommandQueue = clCreateCommandQueue(cxGPUContext, cdDevice, 0, &ret);

	openclRetTackle( ret , "clCreateCommandQueue");

	return CL_SUCCESS;

}

int run()

{

	openclInit();

	system("pause");

	return 0;

}

<span style="font-family:Microsoft YaHei;font-size:18px;">//#include "stdafx.h"

#include <stdio.h>

#include <vector>

#include <CL/cl.h>

#include <iostream>

#include <fstream>

#include <string>

#pragma comment(lib,"OpenCL.lib")

int print_device()

{

	cl_int err;

	cl_uint num;

	err = clGetPlatformIDs(0, 0, &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platforms\n";

		return 0;

	}

	std::vector<cl_platform_id> platforms(num);

	err = clGetPlatformIDs(num, &platforms[0], &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platform ID\n";

		return 0;

	}

	cl_context_properties prop[] = { CL_CONTEXT_PLATFORM, reinterpret_cast<cl_context_properties>(platforms[0]), 0 };

	cl_context context = clCreateContextFromType(prop, CL_DEVICE_TYPE_DEFAULT, NULL, NULL, NULL);

	if(context == 0)

	{

		std::cerr << "Can't create OpenCL context\n";

		return 0;

	}

	size_t cb;

	clGetContextInfo(context, CL_CONTEXT_DEVICES, 0, NULL, &cb);

	std::vector<cl_device_id> devices(cb / sizeof(cl_device_id));

	clGetContextInfo(context, CL_CONTEXT_DEVICES, cb, &devices[0], 0);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, 0, NULL, &cb);

	std::string devname;

	devname.resize(cb);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, cb, &devname[0], 0);

	std::cout << "Device: " << devname.c_str() << "\n";

	clReleaseContext(context);

	return 0;

}

cl_program load_program(cl_context context, const char* filename)

{

	std::ifstream in(filename, std::ios_base::binary);

	if(!in.good())

	{

		return 0;

	}// get file length

	in.seekg(0, std::ios_base::end);

	size_t length = in.tellg();

	in.seekg(0, std::ios_base::beg);

	// read program source

	std::vector<char> data(length + 1);

	in.read(&data[0], length);

	data[length] = 0;

	// create and build program

	const char* source = &data[0];

	cl_program program = clCreateProgramWithSource(context, 1, &source, 0, 0);

	if(program == 0)

	{

		return 0;

	}

	if(clBuildProgram(program, 0, 0, 0, 0, 0) != CL_SUCCESS)

	{

		return 0;

	}

	return program;

}

int main()

{

	print_device();

	cl_int err;

	cl_uint num;

	err = clGetPlatformIDs(0, 0, &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platforms\n";

		return 0;

	}

	std::vector<cl_platform_id> platforms(num);

	err = clGetPlatformIDs(num, &platforms[0], &num);

	if(err != CL_SUCCESS)

	{

		std::cerr << "Unable to get platform ID\n";

		return 0;

	}

	cl_context_properties prop[] = { CL_CONTEXT_PLATFORM, reinterpret_cast<cl_context_properties>(platforms[0]), 0 };

	cl_context context = clCreateContextFromType(prop, CL_DEVICE_TYPE_DEFAULT, NULL, NULL, NULL);

	if(context == 0)

	{

		std::cerr << "Can't create OpenCL context\n";

		return 0;

	}

	size_t cb;

	clGetContextInfo(context, CL_CONTEXT_DEVICES, 0, NULL, &cb);

	std::vector<cl_device_id> devices(cb / sizeof(cl_device_id));

	clGetContextInfo(context, CL_CONTEXT_DEVICES, cb, &devices[0], 0);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, 0, NULL, &cb);

	std::string devname;

	devname.resize(cb);

	clGetDeviceInfo(devices[0], CL_DEVICE_NAME, cb, &devname[0], 0);

	std::cout << "Device: " << devname.c_str() << "\n";

	cl_command_queue queue = clCreateCommandQueue(context, devices[0], 0, 0);

	if(queue == 0)

	{

		std::cerr << "Can't create command queue\n";

		clReleaseContext(context);

		return 0;

	}

	const int DATA_SIZE = 1048576;

	std::vector<float> a(DATA_SIZE), b(DATA_SIZE), res(DATA_SIZE);

	for(int i = 0; i < DATA_SIZE; i++)

	{

		a[i] = std::rand();

		b[i] = std::rand();

	}

	cl_mem cl_a = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_float) * DATA_SIZE, &a[0], NULL);

	cl_mem cl_b = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_float) * DATA_SIZE, &b[0], NULL);

	cl_mem cl_res = clCreateBuffer(context, CL_MEM_WRITE_ONLY, sizeof(cl_float) * DATA_SIZE, NULL, NULL);

	if(cl_a == 0 || cl_b == 0 || cl_res == 0)

	{

		std::cerr << "Can't create OpenCL buffer\n";

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	cl_program program = load_program(context, "..\\shader.txt");

	if(program == 0)

	{

		std::cerr << "Can't load or build program\n";

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	cl_kernel adder = clCreateKernel(program, "adder", 0);

	if(adder == 0)

	{

		std::cerr << "Can't load kernel\n";

		clReleaseProgram(program);

		clReleaseMemObject(cl_a);

		clReleaseMemObject(cl_b);

		clReleaseMemObject(cl_res);

		clReleaseCommandQueue(queue);

		clReleaseContext(context);

		return 0;

	}

	clSetKernelArg(adder, 0, sizeof(cl_mem), &cl_a);

	clSetKernelArg(adder, 1, sizeof(cl_mem), &cl_b);

	clSetKernelArg(adder, 2, sizeof(cl_mem), &cl_res);

	size_t work_size = DATA_SIZE;

	err = clEnqueueNDRangeKernel(queue, adder, 1, 0, &work_size, 0, 0, 0, 0);

	if(err == CL_SUCCESS)

	{

		err = clEnqueueReadBuffer(queue, cl_res, CL_TRUE, 0, sizeof(float) * DATA_SIZE, &res[0], 0, 0, 0);

	}

	if(err == CL_SUCCESS)

	{

		bool correct = true;

		for(int i = 0; i < DATA_SIZE; i++)

		{

			if(a[i] + b[i] != res[i])

			{

				correct = false;

				break;

			}

		}

		if(correct)

		{

			std::cout << "Data is correct\n";

		}

		else

		{

			std::cout << "Data is incorrect\n";

		}

	}

	else

	{

		std::cerr << "Can't run kernel or read back data\n";

	}

	clReleaseKernel(adder);

	clReleaseProgram(program);

	clReleaseMemObject(cl_a);

	clReleaseMemObject(cl_b);

	clReleaseMemObject(cl_res);

	clReleaseCommandQueue(queue);

	clReleaseContext(context);

	return 0;

}</span>

需要使用的数据：

shader.txt

<span style="font-family:Microsoft YaHei;font-size:18px;">__kernel void adder(__global const float* a, __global const float* b, __global float* result)

{

    int idx = get_global_id(0);

    result[idx] = a[idx] + b[idx];

}</span>

CUDA版本的OpenCL在windows 7的下编程初步的更多相关文章

windows下安装python、环境设置、多python版本的切换、pyserial与多版本python安装、windows命令行下切换目录
1.windows下安装python 官网下载安装即可 2.安装后的环境设置我的电脑--属性--高级--设置path的地方添加python安装目录,如C:\Python27;C:\Python33 ...
YOLOv4：目标检测（windows和Linux下Darknet 版本）实施
YOLOv4:目标检测(windows和Linux下Darknet 版本)实施 YOLOv4 - Neural Networks for Object Detection (Windows and L ...
cmake编译opencv时指定cuda版本
之前有网友提问说,基于cmake编译时如果切换cuda版本,比如我同时装了cuda8和cuda9,opencv总是找到cuda9,我想用cuda8怎么办?实际上,手头上要配置的工程是基于opencv3 ...
如何解决pytorch 编译时CUDA版本与运行时CUDA版本不对应
转载请注明: 仰望高端玩家的小清新 http://www.cnblogs.com/luruiyuan/ 如何解决pytorch 编译时CUDA版本与运行时CUDA版本不对应如果pytorch的编译时 ...
cuda 版本查阅
查看cuda版本 cat /usr/local/cuda/version.txt nvcc -V
[AI] 切换cuda版本的万金油
1. 环境 ubuntu16.04 GTX1080Ti x 4 nvidia-418 cuda-10.1 pytorch1.0.0 目标:在最新的显卡驱动下,使用不同版本的cuda和深度学习框架来执行 ...
pytorch Model Linear实现线性回归CUDA版本
实验代码 import torch import torch.nn as nn #y = wx + b class MyModel(nn.Module): def __init__(self): su ...
矩池云里查看cuda版本
可以用下面的命令查看 cat /usr/local/cuda/version.txt 如果想用nvcc来查看可以用下面的命令 nvcc -V 如果环境内没有nvcc可以安装一下,教程是矩池云上如何安装 ...
矩池云上如何修改cuda版本
cuda版本可能对系统,驱动版本会有影响,修改之前需要先进行确认 1.检查系统版本 source /etc/os-release && echo $VERSION_ID 2.导入apt ...

随机推荐

20 ViewPager Demo3指示器
MainActivity.java package com.qf.day20_viewpager_demo3; import java.util.ArrayList; import java.util ...
如何使用excel画甘特图
甘特图小伙伴们都非常的熟悉,首先小编简单的向各位小伙伴介绍一下什么是甘特图,甘特图内在思想简单,即以图示的方式通过活动列表和时间刻度形象地表示出任何特定项目的活动顺序与持续时间.基本是一条线条图,横轴 ...
android orm持久层框架
; ; i < 2; i++) { )); ); h1.setWord("这是修改过的数据"); tv.setText(tv.getText() + "\n&quo ...
DVB数字电视系统简介（DVB-C，DVB-S，DVB-T）
前一段时间在<通信原理>期末的时候研究了一下DVB数字电视系统.视音频编解码这些技术都是属于"信源"的技术,而<通信原理>研究的范围正好是它的补集,属于&q ...
利用openssl管理证书及SSL编程第3部分:将MinGW编译的openssl dll导出def和lib供MSVC使用
将MinGW编译的openssl dll导出def和lib供MSVC使用前面我们用mingw把openssl 编译成了动态库,得到下面2个dll文件: libeay32.dll ssleay32.d ...
Torch的安装和学习
Long long ago, 就已经安装好Torch,这里再记录一下.Torch是Facebook开发的用于AI的科学计算框架,可广泛运用于机器学习的很多算法.相比Caffe,其接口运用更加方便,使用 ...
Java进阶(二十九)Could not create the view: An unexpected exception was thrown
Could not create the view: An unexpected exception was thrown 在将web项目部署到tomcat时,控制台输出以下内容: 这个问题的出现是在 ...
Uva - 810 - A Dicey Problem
根据状态进行bfs,手动打表维护骰子滚动. AC代码: #include <iostream> #include <cstdio> #include <cstdlib&g ...
11、Libgdx的音频
(官网:www.libgdx.cn) Libgdx提供了简单的方法对较小的音效和磁盘中的音乐进行回放.它同样也提供了方便的针对音频硬件的读写权限. 所有的音频操作都通过audio模块来完成: Audi ...
UNIX环境高级编程——标准I/O库
对一个进程预定义了三个流,并且这三个流可以自动的被进程使用,它们是:标准输入.标准输出.和标准错误. 标准I/O库提供缓冲的目的是尽可能减少使用read和write的次数. 标准I/O库提供了三种类型 ...

CUDA版本的OpenCL在windows 7的下编程初步

CUDA版本的OpenCL在windows 7的下编程初步的更多相关文章

随机推荐

热门专题