CUDA与OpenGL互操作

当处理较大数据量的时候，往往会用GPU进行运算，比如OpenGL或者CUDA。在实际的操作中，往往CUDA实现并行计算会比OpenGL更加方便，而OpenGL在进行后期渲染更具有优势。由于CUDA中的运算结果存储在GPU中，如果将数据download到CPU，然后再将CPU中的数据上传到GPU，使用OpenGL进行渲染，中间的GPU与CPU的交互会很耗时，毕竟使用GPU的目的就是为了加速，这样的数据传输会降低效率。

接下来简要说一下如何使CUDA和OpenGL互操作来实现GPU中数据的交互传输，而不用通过主机的CPU。

一、首先是在OpenGL中声明这样一个buffer。

cudaGraphicsResource_t  cudaBuffer;

然后将Buffer注册给纹理texture(假定已经提前声明一个纹理texture)

cudaGraphicsGLRegisterImage(&cudaBuffer, texture, GL_TEXTURE_2D, cudaGraphicsRegisterFlagsWriteDiscard);

二、好了，这样我们只需要把CUDA计算出来的数据写入cudaBuffer中就行了。如下：

利用Cuda中的两个API设置cudaBuffer为映射Map，并将一个cuda数组cudaArray绑定到cudaBuffer。

cudaError_t err;

err = cudaGraphicsMapResources(1, cudaBuffer, 0);

err = cudaGraphicsSubResourceGetMappedArray(&cudaArray, cudaBuffer, 0, 0);

那么接下来的就是把数据写入cudaArray中的事情了，假设我有一个数据指针pResult指向GPU中的一段内存，这段内存中保存的就是CUDA的运算结果(一幅4通道图像)，我只需要将其copy到cudaArray就行了。注意是cudaMemcpyDeviceToDevice，这个很快的。

创建cudaArray

uchar* cudaArray=NULL;

cudaChannelFormatDesc cuDesc = cudaCreateChannelDesc<uchar4>();

cudaMallocArray(&cudaArray, &cuDesc, imgWidth, imgHeight);

将结果数据拷贝至cudaArray

err=cudaMemcpyToArray(cudaArray, 0, 0, pResult, imgWidth*imgHeight * sizeof(uchar4), cudaMemcpyDeviceToDevice);

copy完后要解除映射Map

cudaGraphicsUnmapResources(1, &cudaBuffer, 0);

这样在OpenGL中就可以直接将buffer中的数据注册到纹理然后进行渲染了，so easy~　　

CUDA与OpenGL互操作的更多相关文章

CUDA和OpenGL互操作经典博文赏析和学习
1.使用cuda+opengl图形互操作性实现MPR.原学位论文学习:实时交互的医学图像可视化.在该论文的第5.1.1节. 2.cuda与opengl互操作之PBO 3.cuda与opengl互操作之 ...
CUDA与OpenGL互操作实例
本文要解决的问题是如何实现CUDA和OpenGL的互操作,使得GPU能够将通用计算的运算结果交给OpenGL进行绘制. 本文的应用程序主要包括两个方面: 1. 使用CUDA核函数生成图像数据 ...
[转]CUDA和OpenGL互操作的实现及分析
CUDA和OpenGL互操作的实现及分析刘进锋．郭雷(西北工业大学自动化学院,陕西西安710129) 1 CUDA与OpenGL概述 OpenGL是图形硬件的软件接口,它是在SGI等多家世界著名的计 ...
CUDA 与 OpenGL 的互操作
CUDA 与 OpenGL 的互操作一般是使用CUDA生成数据,然后在OpenGL中渲染数据对应的图形.这两者的结合有两种方式: 1.使用OpenGL中的PBO(像素缓冲区对象).CUDA生成像素数据 ...
cuda+ffmpeg+opengl解码rtsp h264码流多路
Cuda 解码全尺寸解码 .全尺寸窗口绘制测试( 分别测试视频文件和 IP 相机实时视频 ) 1080 p 视屏文件全尺寸解码全尺寸显示 72 0p IP 相机全尺寸解码全 ...
CUDA编程
目录: 1.什么是CUDA 2.为什么要用到CUDA 3.CUDA环境搭建 4.第一个CUDA程序 5. CUDA编程 5.1. 基本概念 5.2. 线程层次结构 5.3. 存储器层次结构 5.4. ...
OpenGL与CUDA互操作方式总结
一.介绍 CUDA是Nvidia推出的一个通用GPU计算平台,对于提升并行任务的效率非常有帮助.本人主管的项目中采用了OpenGL做图像渲染,但是在数据处理方面比较慢,导致帧率一直上不来.于是就尝试把 ...
[转]OpenGL与CUDA互操作方式总结
一.介绍 CUDA是Nvidia推出的一个通用GPU计算平台,对于提升并行任务的效率非常有帮助.本人主管的项目中采用了OpenGL做图像渲染,但是在数据处理方面比较慢,导致帧率一直上不来.于是就尝试把 ...
CUDA基础介绍
一.GPU简介 1985年8月20日ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年4月ATi发布了Mach32图形卡集成了图形加速功能,1998年4月ATi ...

随机推荐

IDA Pro反编译代码类型转换参考
/* This file contains definitions used by the Hex-Rays decompiler output. It has type definitions an ...
python 列表赋值和列表 sort 方法注意的问题
列表赋值 >>> a = b = [] >>> a.append() >>> a [] >>> b [] >>> ...
cobbler自动安装系统（Centos7.X）
环境: [root@kickstart ~]# cat /etc/redhat-release CentOS Linux release (Core) [root@kickstart ~]# unam ...
HashMap分析之红黑树树化过程
概述 HashMap是Java程序员使用频率最高的用于映射(键值对)处理的数据类型.随着JDK(Java Developmet Kit)版本的更新,JDK1.8对HashMap底层的实现进行了优化,例 ...
Java框架之Mybatis（二）
本文主要介绍 Mybatis(一)之后剩下的内容: 1 mybatis 中 log4j的配置 2 dao层的开发(使用mapper代理的方式) 3 mybatis的配置详解 4 输入输出映射对应的类型 ...
Excel Microsoft.Jet.OLEDB.4.0 外部数据库驱动程序中(1)的意外错误
昨天更新系统的bug,据说是微软要搞事情啊删除以下更新就行: win7 KB4041678 KB4041681 SERVER 2008 R2 KB ...
嵌入式Tomcat容器的参数(maxParameterCount)设定
背景昨天同事遇到了error一起看了一下感觉比较重要在这记录一下基本情况是页面上选中9K+的数据向后台发送请求,然后系统就崩了... error信息如下 More than the maximum ...
iOS QQ分享图片无反应问题
受iOS 9 上 http 限制需要在info.plist文件添加必要string <key>LSApplicationQueriesSchemes</key> <ar ...
NC和NO、耳机美标和欧标的区别
NO是常开(NORMAL OPEN),就是通常即未通电状态下,是断开的,通电后在电磁线圈的作用下(吸合)处于闭合状态.NC是常闭(NORMAL CLOSE),就是通常即未通电状态下,是闭合的,通电后在 ...
Nginx概述和安装（1）
一.Nginx概述 Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器. Nginx 是由 I ...

CUDA与OpenGL互操作

CUDA与OpenGL互操作的更多相关文章

随机推荐

热门专题