CUDA 纹理的使用

纹理绑定有两种，一个是绑定到线性内存就是用cudaMalloc();cudaMemcpy();开辟的内存空间，另一种是绑定到cudaMallocArray， cudaMemcpyToArray开辟到的二维数组或者三维数组。

先说比较简单的就是绑定到cudamalloc开辟到的内存空间。

首先是纹理声明：关于纹理的声明和绑定都要在cu文件进行，在其他文件进行会比较麻烦。

首先是开辟显存和赋值给显存。

首先是纹理声明：

1、texture<float, 1, cudaReadModeElementType> texRef;

2、为显存开辟空间，并初始化

cudaMalloc((void **)&rain_table,256*4*3);

cudaMemcpy(rain_table ,table, 256*4*3,cudaMemcpyHostToDevice);

3、纹理绑定：

cudaBindTexture(0,texRef,rain_table );

4、_在global_ kernel函数使用纹理：

vterm = tex1Dfetch(texRef, 3*index);

5、解除纹理：

cudaUnbindTexture(texRef);

cudaFree(table)

以上是一维纹理的使用，接着介绍二维纹理数组的使用：

纹理声明为二维纹理：

注：在1.x和3.x的卡使用纹理回比全局变量的要好，但2.x刚好相反，因为2.X有更大的L1缓存，所以2.x的卡建议不使用纹理，除非测出的速度要比使用全局变量的要快。

1、texture<float, 2, cudaReadModeElementType> texRef;

2、开辟显存：

cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc(32, 0, 0, 0,cudaChannelFormatKindFloat);
cudaArray* cuArray;
cudaMallocArray(&cuArray, &channelDesc, 3, 256); //为cuArray开辟空间
cudaMemcpyToArray(cuArray, 0, 0, table,256*3*4, cudaMemcpyHostToDevice);

3、纹理绑定

cudaBindTextureToArray(texRef, cuArray, channelDesc);

4、使用

vterm = tex2D(texRef, 0,index);

5、解除绑定

cudaBindTextureToArray(texRef,cuArray,channelDesc);

CUDA 纹理的使用的更多相关文章

cuda纹理内存的使用
CUDA纹理内存的访问速度比全局内存要快,因此处理图像数据时,使用纹理内存是一个提升性能的好方法. 贴一段自己写的简单的实现两幅图像加权和的代码,使用纹理内存实现. 输入:两幅图 lena, moon ...
CUDA纹理绑定
纹理绑定的一般步骤: size_t fea_pitch; texture<unsigned char, 2> features2D; cudaMallocPitch((void**)(&a ...
CUDA 纹理内存
原文链接 1.概述纹理存储器中的数据以一维.二维或者三维数组的形式存储在显存中,可以通过缓存加速访问,并且可以声明大小比常数存储器要大的多. 在kernel中访问纹理存储器的操作称为纹理拾取(tex ...
CUDA一维纹理内存
纹理一词来源于GPU图形世界,GPU通用并行计算"盗用"了纹理一词,定义了一个纹理内存的概念.纹理内存缓存在设备上,在某些情况下能减少对内存的请求并降低内存带宽的使用,是专门为那 ...
CUDA 动态编译（NVRTC）简记
在linux上用sublime text 3上写完CUDA代码和c++代码后,想用code::blocks去一并编译,就像visual studio那样一键编译运行,但发现在code::blocks上 ...
osgcuda 【转】
原文 : http://blog.sina.com.cn/s/blog_df1b276a0101inbi.html osgCompute是对代码的并行流处理器执行的抽象基库.库连接到OSG的(OSG) ...
《GPU高性能编程CUDA实战》第七章纹理内存
▶ 本章介绍了纹理内存的使用,并给出了热传导的两个个例子.分别使用了一维和二维纹理单元. ● 热传导(使用一维纹理) #include <stdio.h> #include "c ...
CUDA中多维数组以及多维纹理内存的使用
纹理存储器(texture memory)是一种只读存储器,由GPU用于纹理渲染的图形专用单元发展而来,因此也提供了一些特殊功能.纹理存储器中的数据位于显存,但可以通过纹理缓存加速读取.在纹理存储器中 ...

随机推荐

使用sql语句备份一张表
如何使用sql语句复制一张表? 方法一:第一步:先建一张新表,新表的结构与老表相等. create table newtable like oldtable; 第二步:将老表中的值复制到新标中. in ...
项目中遇到的问题——jsp:include
昨晚记错了,项目中用的是这个<jsp:attribute>,不过没关系,都差不多!原理是传参数具体用法: 假设有两个tag文件 aaa 和 bbb aaa有两个属性:name age ...
The configuration section 'system.serviceModel' cannot be read because it is missing a section decla
将Asp.Net 2.0的Web Site搭建在IIS7(7.5)上时,运行出现500.19错误, 错误提示为 The configuration section 'system.serviceMod ...
vue的简单测试
<!doctype html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
BZOJ3600：没有人的算术
传送门如果能给每个 $pair$ 按照权值编号就好了假设之前已经有了所有的权值的编号,现在考虑编号新的 $pair$ 如果看过了陈立杰的论文的话,不难得到一个重量平衡树的做法给树上每个子 ...
laravel开发之-网站初建
1 cmd 打开电脑命令窗口 2 目录切换到网站根目录 3 输入命令:php artisan serve 4 model 生成命令:php artisan make:model 需要生成的model名 ...
web前端面试题（持续更新）
此文是我本人在面试的时候遇到的问题和一些同学遇到的问题加资料上面的问题的总结.(将会持续更新,因为未有满意工作) 面试时有几点需要注意: 1.面试题目:根据你的等级和职位的变化,入门级到大神级,广度和 ...
统计nginx日志
.根据访问IP统计UV awk '{print $1}' access.log|sort | uniq -c |wc -l .统计访问URL统计PV awk '{print $7}' access.l ...
IEC_62304_CheckList
IEC 62304 Reference Software Lifecycle Process Applicable for Class A Class B Class C PRIMARY LIFECY ...
xcopy-参数详解
XCOPY——目录复制命令 1．功能:复制指定的目录和目录下的所有文件连同目录结构. 2．类型:外部命令 3．格式:XCOPY [源盘:]〈源路径名〉[目标盘符:][目标路径名][/S][/V][/E ...

CUDA 纹理的使用

CUDA 纹理的使用的更多相关文章

随机推荐

热门专题