CUDA+OpenGL混合编程

CUDA+OpenGL混合编程示例：

#include <stdio.h>

#include <stdlib.h>

#include "GL\glew.h"

#include "GL\glut.h"

#include <cuda_runtime.h>

#include <cuda.h>

#include <cuda_gl_interop.h>    

#define GET_PROC_ADDRESS(str) wglGetProcAddress(str)

#define DIM 512    

PFNGLBINDBUFFERARBPROC    glBindBuffer = NULL;

PFNGLDELETEBUFFERSARBPROC glDeleteBuffers = NULL;

PFNGLGENBUFFERSARBPROC    glGenBuffers = NULL;

PFNGLBUFFERDATAARBPROC    glBufferData = NULL;

GLuint bufferObj;

cudaGraphicsResource *resource;

__global__ void cudaGLKernel(uchar4 *ptr)

{

	int x = threadIdx.x + blockIdx.x * blockDim.x;

	int y = threadIdx.y + blockIdx.y * blockDim.y;

	int offset = x + y * blockDim.x * gridDim.x;

	/*float fx = x / (float)DIM - 0.5f;

	float fy = y / (float)DIM - 0.5f;*/

	unsigned char green = 255 * sinf(x*y);

	unsigned char red = 255 * cosf(offset*offset);

	unsigned char blue = 255 * cosf(offset*x*y);

	ptr[offset].x = red;

	ptr[offset].y = green;

	ptr[offset].z = blue;

	ptr[offset].w = 255;

}

void drawFunc(void)

{

	glDrawPixels(DIM, DIM, GL_RGBA, GL_UNSIGNED_BYTE, 0);

	glutSwapBuffers();

}

static void keyFunc(unsigned char key, int x, int y)

{

	switch (key) {

	case 27:

		cudaGraphicsUnregisterResource(resource);

		glBindBuffer(GL_PIXEL_UNPACK_BUFFER_ARB, 0);

		glDeleteBuffers(1, &bufferObj);

		exit(0);

	}

}

int main(int argc, char* argv[])

{

	// 定义一个设备属性对象prop

	cudaDeviceProp prop;

	int dev;

	memset(&prop, 0, sizeof(cudaDeviceProp));

	//限定设备计算功能集的版本号

	prop.major = 1;

	prop.minor = 0;

	//选择在计算功能集的版本号为1.0的GPU设备上运行

	cudaChooseDevice(&dev, &prop);

	//选定GL程序运行的设备

	cudaGLSetGLDevice(dev);

	//OpenGL环境初始化

	glutInit(&argc, argv);

	glutInitDisplayMode(GLUT_DOUBLE | GLUT_RGBA);

	glutInitWindowSize(DIM, DIM);

	glutCreateWindow("CUDA+OpenGL");

	glBindBuffer = (PFNGLBINDBUFFERARBPROC)GET_PROC_ADDRESS("glBindBuffer");

	glDeleteBuffers = (PFNGLDELETEBUFFERSARBPROC)GET_PROC_ADDRESS("glDeleteBuffers");

	glGenBuffers = (PFNGLGENBUFFERSARBPROC)GET_PROC_ADDRESS("glGenBuffers");

	glBufferData = (PFNGLBUFFERDATAARBPROC)GET_PROC_ADDRESS("glBufferData");

	glGenBuffers(1, &bufferObj);

	glBindBuffer(GL_PIXEL_UNPACK_BUFFER_ARB, bufferObj);

	glBufferData(GL_PIXEL_UNPACK_BUFFER_ARB, DIM*DIM * 4, NULL, GL_DYNAMIC_DRAW_ARB);

	cudaGraphicsGLRegisterBuffer(&resource, bufferObj, cudaGraphicsMapFlagsNone);

	uchar4* devPtr;

	size_t size;

	cudaGraphicsMapResources(1, &resource, NULL);

	cudaGraphicsResourceGetMappedPointer((void**)&devPtr, &size, resource);

	dim3 grids(DIM / 16, DIM / 16);

	dim3 threads(16, 16);

	cudaGLKernel << <grids, threads >> > (devPtr);

	cudaGraphicsUnmapResources(1, &resource, NULL);

	glutKeyboardFunc(keyFunc);

	glutDisplayFunc(drawFunc);

	glutMainLoop();

	return 0;

}

在GPU上根据线程索引的正余弦函数生成数据，并把这些数据绑定到OpenGL声明的一个顶点缓冲对象VBO（VBO其实就是显存上的一个存储区域，可以保持大量的顶点属性信息）上，再由OpenGL根据该VBO数据把图像绘制出来，运行效果：

CUDA+OpenGL混合编程的更多相关文章

mpi和cuda混合编程的正确编译
针对大数据的计算,很多程序通过搭建mpi集群进行加速,并取得了很好的效果.算法内部的加速,当前的并行化趋势是利用GPU显卡进行算法加速.针对并行性非常好的算法,GPU加速效果将远大于集群带来的加速效果 ...
CUDA 8混合精度编程
CUDA 8混合精度编程 Mixed-Precision Programming with CUDA 8 论文地址:https://devblogs.nvidia.com/mixed-precisio ...
cocos2d 2.0和UIKit混合编程, Push CCDirector的时候出现黑屏的天坑
症状使用cocos2d 2.0和UIKit混合编程, 有一块用cocos2d编写的小程序, 将CCDirector push到一个UINavigationController里面. 虽然事先在后台初 ...
C++和MATLAB混合编程求解多项式系数（矩阵相除）
摘要:MATLAB对于矩阵处理是非常高效的,而C++对于矩阵操作是非常麻烦的,因而可以采用C++与MATLAB混合编程求解矩阵问题. 主要思路就是,在MATLAB中编写函数脚本并使用C++编译为dll ...
如玫瑰一般的PHP与C#混合编程
故事背景是这样的,有一套项目,服务器端是用C#写的,为了完成某种事情,它需要使用到一个组件,这个组件很小但很重要,很不巧的是,这个这个组件是用PHP语言写的,如果为了使用这个组件而专门搭建一个PHP的 ...
C和C++混合编程中的extern "C" {}
引言在用C++的项目源码中,经常会不可避免的会看到下面的代码: 1 2 3 4 5 6 7 8 9 #ifdef __cplusplus extern "C" { #endif ...
C# 托管和非托管混合编程
在非托管模块中实现你比较重要的算法,然后通过 CLR 的平台互操作,来使托管代码调用它,这样程序仍然能够正常工作,但对非托管的本地代码进行反编译,就很困难. 最直接的实现托管与非托管编程的方法就是 ...
[转载：]C#与Fortran混合编程之本地调用Fortran动态链接库
前言 C#发展到现在,已是一门相当完善的语言,他基于C语言风格,演化于C++.并依靠强大的.NET底层框架.C#可以用来快速构建桌面及Web应用.然而在我们的实际工作中,尽管C#已经非常完善,但还是不 ...
C#Matlab混合编程类初始化问题解决方法
************** 异常文本 ************** System.TypeInitializationException: “myPlus.matClass”的类型初始值设定项引发异 ...

随机推荐

Qt5 UI信号、槽自动连接的控件重名大坑（UI生成的槽函数存在一个隐患，即控件重名。对很复杂的控件，不要在 designer 里做提升，而是等到程序启动后，再动态创建，可以避免很多问题）
对Qt5稍有熟悉的童鞋都知道信号.槽的自动连接机制.该机制使得qt designer 设计的UI中包含的控件,可以不通过显式connect,直接和cpp中的相应槽相关联.该机制的详细文章见 http: ...
Redis笔记---set
1.redis set的介绍集合中的数据是不重复且没有顺序,集合类型和列表类型的对比. 集合类型:存储的是的是最多2的32次方减一个字符串,数据是没有顺序的,但是数据是唯一的列表类型:最多存储内容 ...
PHP回调函数--call_user_func_array
我这是抄的感谢 https://www.cnblogs.com/zzl-21086595/p/4547519.html 全局函数的回调这里的全局函数的意思,是直接使用function定义的函数,它 ...
IE block my cookie in iframe
---恢复内容开始--- There is a severe bug that a leader figured it out in a published project. In IE11, the ...
使用u盘量产工具修复写保护的u盘
自己的u盘突然提示写保护,而且也没有写保护开关,怎么都写不进文件,试了很多办法都无法去除写保护,最后找了一个u盘量产工具,搞定: 插上u盘后,会检测到u盘,点“开始"后静静等待它完成,u盘又 ...
u-boot-2011.06在基于s3c2440开发板的移植之引导内核与加载根文件系统
http://www.linuxidc.com/Linux/2012-09/70510.htm 来源:Linux社区作者:赵春江 uboot最主要的功能就是能够引导内核启动.本文就介绍如何实现该 ...
Nginx+Memcached+Tomcat集群配置(MSM--win7 64bit)
本次主要是在win7 64 上演示操作. web应用构建 Memcached安装配置启动 Tomcat配置所需jar包 memcached-session-manager 序列化 contextxm ...
JAVA Concurrent包中的并发集合类
我们平时写程序需要经常用到集合类,比如ArrayList.HashMap等,但是这些集合不能够实现并发运行机制,这样在服务器上运行时就会非常的消耗资源和浪费时间,并且对这些集合进行迭代的过程中不能进行 ...
【Nutch2.2.1基础教程之6】Nutch2.2.1抓取流程分类： H3_NUTCH 2014-08-15 21:39 2530人阅读评论(1) 收藏
一.抓取流程概述 1.nutch抓取流程当使用crawl命令进行抓取任务时,其基本流程步骤如下: (1)InjectorJob 开始第一个迭代 (2)GeneratorJob (3)FetcherJ ...
Android 控件EditText的setOnEditorActionListener方法的理解
需要注意的是 setOnEditorActionListener这个方法,并不是在我们点击EditText的时候触发,也不是在我们对EditText进行编辑时触发,而是在我们编辑完之后点击软键盘上的回 ...

CUDA+OpenGL混合编程

CUDA+OpenGL混合编程的更多相关文章

随机推荐

热门专题