CUDA 与 OpenGL 的互操作

　　CUDA 与 OpenGL 的互操作一般是使用CUDA生成数据，然后在OpenGL中渲染数据对应的图形。这两者的结合有两种方式：

　　　　1、使用OpenGL中的PBO（像素缓冲区对象）。CUDA生成像素数据，OpenGL直接渲染即可。

　　　　2、使用OpenGL中的FBO（顶点缓冲区对象）。CUDA生成顶点数据，OpenGL渲染。

　　这两种方法的核心都是将OpenGL中的缓冲区对象映射到CUDA内存空间中（让CUDA的内存指针指向OpenGL的缓冲区），这样就不需要将缓冲区中的数据传输至CUDA内存中，然后利用CUDA的高并行计算性能加速计算，最后直接使用OpenGL渲染。

　　一个例子，使用CUDA根据时间动态生成16个点，在屏幕上显示。

　　步骤：

　　1、设置与OpenGL互操作的设备

status=cudaGLSetGLDevice();

　　2、在CUDA中注册缓冲区对象

status = cudaGLRegisterBufferObject(this->VBO);

　　3、映射缓冲区对象：让CUDA内存指针指向缓冲区对象对应的空间

// 映射缓冲对象

    float4* position;

    status=cudaGLMapBufferObject((void**)&position, this->VBO);

　　4、运行核函数

// 运行核函数

    dim3 dimBlock(, , );

    dim3 dimGrid();

    KernelFunc<<<dimGrid, dimBlock>>>(position, clock(), , );

    cudaThreadSynchronize(); //同步线程

　　5、取消映射

status=cudaGLUnmapBufferObject(this->VBO);

　效果图：

　　注意：当CUDA的kernel函数修改CUDA指针指向的空间超出OpenGL缓冲对象大小时，会导致后面出现取消映射失败。（这里所说的CUDA指针是映射到OpenGL缓冲对象的）

　　完整代码如下：

.cuh文件

#include "cuda_runtime.h" //CUDA运行时API

#include "device_launch_parameters.h"

#include <cuda.h>

#include "GL/glew.h"

#include <cuda_gl_interop.h>

#include <iostream>

#include <stdio.h>

class GenVertex

{

public:

    GenVertex();

    ~GenVertex();

    void setVBO(unsigned int vbo);

    void createVtxWithCuda();

private:

    unsigned int VBO;

private:

    void setup();

};

.cu文件

#include "GenVertex.cuh"

#include <time.h>

__global__ void KernelFunc(float4* position, float time, unsigned int width, unsigned int height)

{

    unsigned int x = blockIdx.x*blockDim.x + threadIdx.x;

    unsigned int y = blockIdx.y*blockDim.y + threadIdx.y;

    float u = x / (float)width;

    float v = y / (float)height;

    u = u*2.0f - 1.0f;

    v = v*2.0f - 1.0f;

    float freq = 4.0f;

    float w = sinf(u*freq + time*0.001f)*cosf(v*freq + time*0.001f)*0.5f;

    position[y*width + x] = make_float4(u*, w*, v*, 1.0f);

}

GenVertex::GenVertex()

{

    this->setup();

}

GenVertex::~GenVertex()

{

}

void GenVertex::setup() {

    cudaError_t status;

    //设备设置

    status=cudaGLSetGLDevice();

    if (status != cudaSuccess) {

        puts("setup Device failed!");

    }

}

void GenVertex::setVBO(unsigned int vbo) {

    this->VBO = vbo;

    cudaError_t status;

    status = cudaGLRegisterBufferObject(this->VBO);

    if (status != cudaSuccess) {

        puts("Register buffer object failed!");

    }

}

void GenVertex::createVtxWithCuda()

{

    cudaError_t status;

    // 映射缓冲对象

    float4* position;

    status=cudaGLMapBufferObject((void**)&position, this->VBO);

    if (status != cudaSuccess) {

        puts("map buffer object failed!");

    }

    // 运行核函数

    dim3 dimBlock(, , );

    dim3 dimGrid();

    KernelFunc<<<dimGrid, dimBlock>>>(position, clock(), , );

    cudaThreadSynchronize(); //同步线程

    status=cudaGLUnmapBufferObject(this->VBO);

    if (status != cudaSuccess) {

        puts("unmap buffer object failed!");

    }

}

CUDA 与 OpenGL 的互操作的更多相关文章

CUDA与OpenGL互操作实例
本文要解决的问题是如何实现CUDA和OpenGL的互操作,使得GPU能够将通用计算的运算结果交给OpenGL进行绘制. 本文的应用程序主要包括两个方面: 1. 使用CUDA核函数生成图像数据 ...
CUDA与OpenGL互操作
当处理较大数据量的时候,往往会用GPU进行运算,比如OpenGL或者CUDA.在实际的操作中,往往CUDA实现并行计算会比OpenGL更加方便,而OpenGL在进行后期渲染更具有优势.由于CUDA中的 ...
CUDA和OpenGL互操作经典博文赏析和学习
1.使用cuda+opengl图形互操作性实现MPR.原学位论文学习:实时交互的医学图像可视化.在该论文的第5.1.1节. 2.cuda与opengl互操作之PBO 3.cuda与opengl互操作之 ...
[转]CUDA和OpenGL互操作的实现及分析
CUDA和OpenGL互操作的实现及分析刘进锋．郭雷(西北工业大学自动化学院,陕西西安710129) 1 CUDA与OpenGL概述 OpenGL是图形硬件的软件接口,它是在SGI等多家世界著名的计 ...
cuda+ffmpeg+opengl解码rtsp h264码流多路
Cuda 解码全尺寸解码 .全尺寸窗口绘制测试( 分别测试视频文件和 IP 相机实时视频 ) 1080 p 视屏文件全尺寸解码全尺寸显示 72 0p IP 相机全尺寸解码全 ...
CUDA基础介绍
一.GPU简介 1985年8月20日ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年4月ATi发布了Mach32图形卡集成了图形加速功能,1998年4月ATi ...
OpenGL与CUDA互操作方式总结
一.介绍 CUDA是Nvidia推出的一个通用GPU计算平台,对于提升并行任务的效率非常有帮助.本人主管的项目中采用了OpenGL做图像渲染,但是在数据处理方面比较慢,导致帧率一直上不来.于是就尝试把 ...
[转]OpenGL与CUDA互操作方式总结
一.介绍 CUDA是Nvidia推出的一个通用GPU计算平台,对于提升并行任务的效率非常有帮助.本人主管的项目中采用了OpenGL做图像渲染,但是在数据处理方面比较慢,导致帧率一直上不来.于是就尝试把 ...
CUDA编程
目录: 1.什么是CUDA 2.为什么要用到CUDA 3.CUDA环境搭建 4.第一个CUDA程序 5. CUDA编程 5.1. 基本概念 5.2. 线程层次结构 5.3. 存储器层次结构 5.4. ...

随机推荐

SQL注入：POST注入
POST注入简介 POST注入属于注入的一种,相信大家在之前的课程中都知道POST\GET两种传参方式. POST注入就是使用POST进行传参的注入,本质上和GET类型的没什么区别. POST注入高危 ...
Linux-3.14.12内存管理笔记【伙伴管理算法（1）】
前面分析了memblock算法.内核页表的建立.内存管理框架的构建,这些都是x86处理的setup_arch()函数里面初始化的,因地制宜,具有明显处理器的特征.而start_kernel()接下来的 ...
python简单处理excel方法
python自带xlrd和xlwt模块用来处理excel,但总觉得xlwt模块用着别扭,于是按自己的习惯重新封装了一个 # coding=utf- import xlrd # 读模块 import x ...
对比keep-alive路由缓存设置的2种方式
方式有两种 .路由元信息(2.1.0版本之前) .属性方式(2.1.0版本之后新增) Vue2.1.0之前: 想实现类似的操作,你可以: 配置一下路由元信息创建两个keep-alive标签使用v- ...
【转】关闭firefox火狐浏览器下载完成时自动扫描（49.0.2以后版本）
用firefox火狐浏览器下载文件到最后时,会显示"剩余时间未知",将持续10秒钟左右,即使几KB 的文件,也要持续这么长时间,问度娘才知道是自动扫描,检查是否有毒,用的却是Goo ...
poj 3070 矩阵计算Fibonacci
地址 http://poj.org/problem?id=3070 大意是输入一个数字输出位于Fibonacci数列该位置的数字模10000的结果由于n比较大 0 ≤ n ≤ 1,000,000, ...
VUE 实现监听滚动事件，实现数据懒加载
methods: { // 获取滚动条当前的位置 getScrollTop() { let scrollTop = 0 if (document.documentElement && ...
【python爬虫】requests模块
文档:从 pythoneer 到 pythonista 的100个模块链接:http://note.youdao.com/noteshare?id=2b95bb3651c21af80ca1936f8 ...
修改SQL Server中的计算机名
安装SQL Server之后,如果修改计算机名会导致登录异常,或者某些功能不能用,例如配置Replication时会提示如下错误: SQL Server replication requires th ...
自动编写Python程序的神器,Python 之父都发声力挺！
就在不久前,kite——那个能够自己编写python代码的AI,Python 之父 Guido van Rossum 使用之后,也发出了「really love」感叹,向大家墙裂推荐了这一高效工具 ...

CUDA 与 OpenGL 的互操作

CUDA 与 OpenGL 的互操作的更多相关文章

随机推荐

热门专题