OpenCL 管道

▶ 按书上写的管道的代码，需要使用 OpenCL2.0 的平台和设备，目前编译不通过，暂时不知道是什么问题，先把代码堆上来，以后换了新的设备再说

● 程序主要功能：用主机上的数组 srcHost 创建设备缓冲区 src，调用核函数 pipeProducer 将 src 分装到管道中，再调用核函数 pipeConsumer 将管道中的数据读到设备缓冲区 dst 中，最后拷贝回主机数组 dstHost 中检查结果。

● 代码

 //pipe.cl

 __kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)

 {

     int gid = get_global_id();

     float srcPipe = src[gid];

     reserve_id_t resID = reserve_write_pipe(outPipe, );

     if (is_valid_reserve_id(resID))

     {

         if (write_pipe(outPipe, resID, , &srcPipe) != )

             return;

         commit_write_pipe(outPipe, resID);

     }

 }

 __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)

 {

     int gid = get_global_id();

     float dstPipe;

     reserve_id_t resID = reserve_read_pipe(inPipe, );

     if (is_valid_reserve_id(resID))

     {

         if (read_pipe(inPipe, resID, , &dstPipe) != )

             return;

         commit_read_pipe(inPipe, resID);

     }

     dst[gid] = dstPipe;

 }

 //main.c

 #include <stdio.h>

 #include <stdlib.h>

 #include <cl.h>

 const char *sourceCode = "D:/Code/pipe.cl";

 char* readSource(const char* kernelPath)// 读取文本文件，存储为 char *

 {

     FILE *fp;

     char *source;

     long int size;

     //printf("readSource, Program file: %s\n", kernelPath);

     fopen_s(&fp, kernelPath, "rb");

     if (!fp)

     {

         printf("Open kernel file failed\n");

         exit(-);

     }

     if (fseek(fp, , SEEK_END) != )

     {

         printf("Seek end of file faildd\n");

         exit(-);

     }

     if ((size = ftell(fp)) < )

     {

         printf("Get file position failed\n");

         exit(-);

     }

     rewind(fp);

     if ((source = (char *)malloc(size + )) == NULL)

     {

         printf("Allocate space failed\n");

         exit(-);

     }

     fread(source, , size, fp);

     fclose(fp);

     source[size] = '\0';

     return source;

 }

 int main()

 {

     const int nPacket = , dataSize = nPacket * sizeof(float);

     char info[] = {  };

     int i;

     // 初始化平台

     cl_int status;

     cl_platform_id platform;

     clGetPlatformIDs(, &platform, NULL);

     cl_device_id device;

     clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, , &device, NULL);

     cl_context_properties contextProp[] = { CL_CONTEXT_PLATFORM,(cl_context_properties)(platform),  };

     cl_context context = clCreateContext(contextProp, , &device, NULL, contextProp, &status);

     cl_command_queue queue = clCreateCommandQueueWithProperties(context, device, NULL, &status);

     cl_event eventProducer, eventConsumer; 

     const char* source = readSource(sourceCode);

     cl_program program = clCreateProgramWithSource(context, , &source, NULL, &status);

     status = clBuildProgram(program, , &device, "-w -g –cl-std=CL2.0", NULL, NULL);

     clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, , info, NULL);

     printf("Build log:\n%s\n", info);

     cl_kernel kernelProducer = clCreateKernel(program, "pipeProducer", &status);

     cl_kernel kernelConsumer = clCreateKernel(program, "pipeConsumer", &status);

     size_t globalSize = nPacket, localSize = ;

     float *srcHost = (float *)malloc(dataSize);

     float *dstHost = (float *)malloc(dataSize);

     for (i = ; i < nPacket; srcHost[i] = i, dstHost[i] = 0.0f, i++);

     cl_mem src, dst;

     src = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, dataSize, srcHost, &status);

     dst = clCreateBuffer(context, CL_MEM_WRITE_ONLY, dataSize, NULL, &status);

     cl_mem pipe = clCreatePipe(context, CL_MEM_HOST_NO_ACCESS, sizeof(float), nPacket, NULL, &status);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem),src);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem), dst);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe);

     clEnqueueNDRangeKernel(queue, kernelProducer, , NULL, &globalSize, &localSize, , NULL, &eventProducer);

     clEnqueueNDRangeKernel(queue, kernelConsumer, , NULL, &globalSize, &localSize, , &eventProducer, &eventConsumer);

     clEnqueueReadBuffer(queue, dst, CL_TRUE, dataSize, dataSize, dstHost, , &eventConsumer, NULL);

     clFinish(queue);

     for (i = ; i < nPacket; i++)

     {

         if (dstHost[i] != i)

             break;

     }

     printf("Output is %s.\n", (i == nPacket) ? "correct" : "incorrect");

     free(srcHost);

     free(dstHost);

     clReleaseContext(context);

     clReleaseCommandQueue(queue);

     clReleaseProgram(program);

     clReleaseKernel(kernelProducer);

     clReleaseKernel(kernelConsumer);

     getchar();

     return ;

 }

● 输出结果

■ 使用编译参数 "-w -g –cl-std=CL2.0" 时返回 status 为 -43（CL_INVALID_BUILD_OPTIONS），不使用参数 "–cl-std=CL2.0" 的情况下返回 -11（CL_BUILD_PROGRAM_FAILURE），麻烦的是调用函数 clGetProgramBuildInfo 查询编译日志 info 始终都是空的，不知道出了什么问题。

■ 转机，去掉了修饰符 __write_only 和 __read_only（只用于图像类型的缓冲区），返回 status 为 -11，至少报错信息有了：【identifier "pipe" is undefined】和【invalid combination of type specifiers】（指在 float 上）

● 后续代码，但是上述代码都编译不了，下面的也暂时没用。（1）使用局部内存来统一工作组的写入

 //pipe2.cl

 __kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)

 {

     int gid = get_global_id(), lid = get_local_id();

     __local reserve_id_t resID;

     if (lid == )

         resID = reserve_write_pipe(outPipe, get_local_size()); // 工作组中首个工作项一次预定多个管道位置

     barrier(CLK_LOCAL_MEM_FENCE);

     float srcPipe = src[id];

     if (is_valid_reserve_id(resID))

     {

         if (write_pipe(outPipe, resID, lid, &srcPipe) != )     // 每个工作项写入预定的位置

             return;

         commit_write_pipe(outPipe, resID);

     }

 }

 __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)

 {

     int gid = get_global_id(), lid = get_local_id();

     __local reserve_id_t resID;

     if (lid == )

         resID = reserve_read_pipe(inPipe, get_local_size());

     barrier(CLK_LOCAL_MEM_FENCE);

     float dstPipe;

     if (is_valid_reserve_id(resID))

     {

         if (read_pipe(inPipe, resID, lid, &dstPipe) != )

             return;

         commit_read_pipe(inPipe, resID);

     }

     dst[gid] = dstPipe;

 }

● （2）使用工作组管道操作简化上述代码（只是干掉了一个 if 和一个同步）

 //pipe3.cl

 __kernel void pipeProducer(__global float *src, __write_only pipe float outPipe)

 {

     int gid = get_global_id(), lid = get_local_id();

     __local reserve_id_t resID = work_group_reserve_write_pipe(outPipe, get_local_size());// 自带分支和同步

     float srcPipe = src[id];

     if (is_valid_reserve_id(resID))

     {

         if (write_pipe(outPipe, resID, lid, &srcPipe) != )

             return;

         commit_write_pipe(outPipe, resID);

     }

 }

 __kernel void pipeConsumer(__global float *dst, __read_only pipe float inPipe)

 {

     int gid = get_global_id(), lid = get_local_id();

     __local reserve_id_t resID = work_group_reserve_read_pipe(inPipe, get_local_size());    

     float dstPipe;

     if (is_valid_reserve_id(resID))

     {

         if (read_pipe(inPipe, resID, lid, &dstPipe) != )

             return;

         commit_read_pipe(inPipe, resID);

     }

     dst[gid] = dstPipe;

 }

● 书上原本的主函数的内容（关于数据缓冲区的部分），是用虚拟内存写的，由于办公室的电脑不支持，上面的代码中被我换成了普通缓冲区

     float *src = (float *)clSVMAlloc(context, CL_MEM_READ_WRITE | CL_MEM_SVM_FINE_GRAIN_BUFFER, dataSize, );

     float *dst = (float *)clSVMAlloc(context, CL_MEM_READ_WRITE | CL_MEM_SVM_FINE_GRAIN_BUFFER, dataSize, );

     if (src == NULL || dst == NULL)

     {

         printf("clSVMAlloc failed!\n");

         getchar();

         return ;

     }

     clEnqueueSVMMap(queue, CL_TRUE, CL_MAP_WRITE, src, dataSize, , NULL, NULL);

     for (i = ; i < nPacket; i++)

         src[i] = i, dst[i] = 0.0f;

     clEnqueueSVMUnmap(queue, src, , NULL, NULL);

     cl_mem pipe = clCreatePipe(context, CL_MEM_HOST_NO_ACCESS, sizeof(float), nPacket, NULL, &status);

     clSetKernelArgSVMPointer(kernelProducer, , src);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe);

     clSetKernelArgSVMPointer(kernelProducer, , dst);

     clSetKernelArg(kernelProducer, , sizeof(cl_mem), &pipe);

     clEnqueueNDRangeKernel(queue, kernelProducer, , NULL, &globalSize, &localSize, , NULL, &eventProducer);

     clEnqueueNDRangeKernel(queue, kernelConsumer, , NULL, &globalSize, &localSize, , &eventProducer,NULL);

     clFinish(queue);

     clEnqueueSVMMap(queue, CL_TRUE, CL_MAP_READ, dst, dataSize, , NULL, NULL);

     for (i = ; i < nPacket; i++)

     {

         if (dst[i] != i)

             break;

     }

     printf("Output is %s.\n", (i == nPacket) ? "correct" : "incorrect");

     clEnqueueSVMUnmap(queue, dst, , NULL, NULL);

OpenCL 管道的更多相关文章

通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性
引言在过去的十年里, GPU (图形处理单元)已经从特殊硬件(特供)转变成能够在数值计算领域开辟新篇章的高性能计算机设备. 很多算法能够使用拥有巨大的处理能力的GPU来快速运行和处理大数据量.即使在 ...
[译]Vulkan教程(13)图形管道基础之Shader模块
[译]Vulkan教程(13)图形管道基础之Shader模块 Shader modules Unlike earlier APIs, shader code in Vulkan has to be s ...
OpenCL Kernel设计优化
使用Intel® FPGA SDK for OpenCL™ 离线编译器,不需要调整kernel代码便可以将其最佳的适应于固定的硬件设备,而是离线编译器会根据kernel的要求自适应调整硬件的结构. 通 ...
ASP.NET Core HTTP 管道中的那些事儿
前言马上2016年就要过去了,时间可是真快啊. 上次写完 Identity 系列之后,反响还不错,所以本来打算写一个 ASP.NET Core 中间件系列的,但是中间遇到了很多事情.首先是 NPOI ...
.NET Core中间件的注册和管道的构建（3） ---- 使用Map/MapWhen扩展方法
.NET Core中间件的注册和管道的构建(3) ---- 使用Map/MapWhen扩展方法 0x00 为什么需要Map(MapWhen)扩展如果业务逻辑比较简单的话,一条主管道就够了,确实用不到 ...
.NET Core中间件的注册和管道的构建（2）---- 用UseMiddleware扩展方法注册中间件类
.NET Core中间件的注册和管道的构建(2)---- 用UseMiddleware扩展方法注册中间件类 0x00 为什么要引入扩展方法有的中间件功能比较简单,有的则比较复杂,并且依赖其它组件.除 ...
.NET Core中间件的注册和管道的构建（1）---- 注册和构建原理
.NET Core中间件的注册和管道的构建(1)---- 注册和构建原理 0x00 问题的产生管道是.NET Core中非常关键的一个概念,很多重要的组件都以中间件的形式存在,包括权限管理.会话管理 ...
【翻译】MongoDB指南/聚合——聚合管道
[原文地址]https://docs.mongodb.com/manual/ 聚合聚合操作处理数据记录并返回计算后的结果.聚合操作将多个文档分组,并能对已分组的数据执行一系列操作而返回单一结果.Mo ...
学习ASP.NET Core, 怎能不了解请求处理管道[6]: 管道是如何随着WebHost的开启被构建出来的？
注册的服务器和中间件共同构成了ASP.NET Core用于处理请求的管道, 这样一个管道是在我们启动作为应用宿主的WebHost时构建出来的.要深刻了解这个管道是如何被构建出来的,我们就必须对WebH ...

随机推荐

20155310 2016-2017-2 《Java程序设计》第八周学习总结
20155310 2016-2017-2 <Java程序设计>第八周学习总结教材学习内容总结第十五章通用API 通用API •日志:日志对信息安全意义重大,审计.取证.入侵检验等都会 ...
BZOJ4897: [Thu Summer Camp2016]成绩单【DP of DP】
Description 期末考试结束了,班主任L老师要将成绩单分发到每位同学手中.L老师共有n份成绩单,按照编号从1到n的顺序叠放在桌子上,其中编号为i的成绩单分数为w_i.成绩单是按照批次发放的. ...
从dfs向动态规划过渡
据说每一个dfs,都能用动态规划思想做出来. 首先要明白dfs与动态规划的一些小要点 1)dfs重在通过使用递归来使用不同的选择,通过使用形参的改变实现不同情景的改变(形参既包括了代价,又包含了结 ...
JS校验 if (! temp_var) {} //拦截 ''和 undefined
if (! aaa) {} //拦截 ' ' 和 undefined 和 0 不拦截null
mysql 如何选择随机行
最简单的方式是使用 mysql 的 ORDER BY RAND() 子句. SELECT col1 FROM tbl ORDER BY RAND() LIMIT 10; 它能很好的运行 ...
【MVC】View的使用
/Views/_ViewStart.cshtml 文件会在其他视图文档被加载之前被载入,代码如下: @{ Layout = "~/Views/Shared/_Layout.cshtml&qu ...
RAC1——Clusterware概念简介1
一集群环境下的一些特殊问题 1.1 并发控制在集群环境中, 关键数据通常是共享存放的,比如放在共享磁盘上. 而各个节点的对数据有相同的访问权限, 这时就必须有某种机制能够控制节点对数据的访问. O ...
JVM 之：Class 类文件结构
类文件结构 Class 文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在 Class 文件中,中间没有添加任何分隔符,这使得整个 Class 文件中存储的内容几乎全部都是 ...
Spring MVC 向页面传值-Map、Model、ModelMap、ModelAndView
Spring MVC 向页面传值,有4种方式: ModelAndView Map Model ModelMap 使用后面3种方式,都是在方法参数中,指定一个该类型的参数. Model Model 是一 ...
rainmeter 修正天气插件信息不准确设置居住城市
rainmeter天气插件的原理是用爬虫抓取一个天气网页然后用自带的那一套正则表达式匹配出天气信息在国外官网社区下载的插件的天气信息城市都会出现问题(因为插件作者又不知道你在哪),解决方法是在原基础 ...

OpenCL 管道

OpenCL 管道的更多相关文章

随机推荐

热门专题