前言

  本文的目的很明确:介绍如何将二维数组传递进显存,以及如何将二维数组从显存传递回主机端。

实现步骤

  1. 在显存中为二维数组开辟空间

  2. 获取该二维数组在显存中的 pitch 值 (cudaMallocPitch 实现)

  3. 将二维数组传递进显存 (cudaMemcpy2D 实现)

  4. 在显存中对该二维数组进行处理 (目前必须按照 1 维数组的规则进行处理)

  5. 将结果传递回内存 (cudaMemcpy2D实现)

重要概念 - pitch

  对于内存的存取来说,对准偏移量为2的幂(现在一般要求2^4=16)的地址能获取更快的速度,而如果不对齐,可能你需要的数据需要更多的存取次数才能得到。

  为了满足这个条件,对于一个二维数组来说(行优先row major),就希望每一行的开头都满足“对齐”。如果一行的长度不规整,导致下一行开头不在指定的位置,就需要在每一行末尾进行填充(padding),从而使得每一行都对齐,这和BMP格式的像素存储是一个道理。

  pitch就是指每一行的字节数 + padding的字节数 。

  使用 cudaMemcpy2D 的目的仅是为了利用 pitch 机制提升二维数组中元素的访问速度。事实上二维数组传递进显存后,还是得按照一维数组的规范去处理该二维矩阵。global 函数中目前不支持多下标访问,好坑。。

代码示例

 #include "cuda.h"
#include "cuda_runtime.h" #include <iostream> using namespace std; // 定义测试二维数组的行列数
const int R = ;
const int C = ; int main()
{
// 定义一个用于测试的二维数组,其每个元素都赋值为0,并将其打印出来。
int array2D[R][C];
cout << "传输前的测试矩阵:" << endl;
for (int i=; i<R; i++) {
for (int j=; j<C; j++) {
array2D[i][j] = ;
cout << array2D[i][j] << " ";
}
cout << endl;
} // 再定义另一个同样大小的二维数组用于获取从显存传回的结果
int result[R][C];
cout << "传输前的结果矩阵:" << endl;
for (int i=; i<R; i++) {
for (int j=; j<C; j++) {
result[i][j] = ;
cout << result[i][j] << " ";
}
cout << endl;
} // 为此二维数组在显存中分配内存
int *d_array2D;
cudaMalloc ((void**)&d_array2D, sizeof(int)*R*C); // 获取显存中的二维数组的 pitch 值
size_t d_pitch;
cudaMallocPitch ((void**) &d_array2D, &d_pitch, sizeof(int)*C, R); // 将二维数组转移进显存
cudaMemcpy2D (
d_array2D, // 目的地址
d_pitch, // 目的 pitch
array2D, // 源地址
sizeof(int)*C, // 源 pitch
sizeof(int)*C, // 数据拷贝宽度
R, // 数据拷贝高度
cudaMemcpyHostToDevice // 数据传递方向
); // 将二维数组从显存传输回主机端的结果矩阵中
cudaMemcpy2D (
result, // 目的地址
sizeof(int)*C, // 目的 pitch
d_array2D, // 源地址
d_pitch, // 源 pitch
sizeof(int)*C, // 数据拷贝宽度
R, // 数据拷贝高度
cudaMemcpyDeviceToHost // 数据传递方向
); // 打印传回到结果矩阵的数据
cout << "从显存获取到测试矩阵后的结果矩阵:" << endl;
for (int i=; i<R; i++) {
for (int j=; j<C; j++) {
cout << result[i][j] << " ";
}
cout << endl;
} cudaFree (d_array2D); cin.get(); return EXIT_SUCCESS;
}

运行测试

  

小结

  本文介绍的仅仅是二维数组在两端之间的传输!当二维数组传递进了显存,在对其操作的过程中,是需要对其进行一个一维到二维的下标操作转换的,global 中不支持多下标访问。之所以加入 pitch 并使用 cudaMemcpy2D 只是为了提高元素的访问速度。

  如果需要具体处理传递进入的二维数组,还要将 pitch 也作为参数传递进 kernel 函数,如下所示:

// 下面的 kernel 函数将二维数组的所有位置为 2
__global__
void kernelFun (int *d_array2D, int pitch)
{
for (int i=; i<R; i++) {
int *row = (int *)((char *)d_array2D+i*pitch);
for (int j=; j<C; j++) {
row[j] = ;
}
} return;
}

二维数组的传输 (host <-> device)的更多相关文章

  1. 第六篇:二维数组的传输 (host <-> device)

    前言 本文的目的很明确:介绍如何将二维数组传递进显存,以及如何将二维数组从显存传递回主机端. 实现步骤 1. 在显存中为二维数组开辟空间 2. 获取该二维数组在显存中的 pitch 值 (cudaMa ...

  2. 二维数组 cudaMallocPitch() 和三维数组 cudaMalloc3D() 的使用

    ▶ 使用函数 cudaMallocPitch() 和配套的函数 cudaMemcpy2D() 来使用二维数组.C 中二维数组内存分配是转化为一维数组,连贯紧凑,每次访问数组中的元素都必须从数组首元素开 ...

  3. dbda封装类(包括:返回二维数组、Ajax调用返回字符串、Ajax调用返回JSON)

    <?php class DBDA { public $host = "localhost"; public $uid = "root"; public $ ...

  4. MVC5中使用jQuery Post 二维数组和一维数组到Action

    很久没有写了,最近在做一个MVC项目,这是我做的第一个MVC项目.之前可以说多MVC一点都不了解,今天把昨天遇到的一个问题记录下来.MVC大神就请飘过吧,跟我遇到同样问题的可以进来看看.遇到的第一个问 ...

  5. PHP 二维数组根据某个字段排序

    二维数组根据某个字段排序有两种办法,一种是通过sort自己写代码,一种是直接用array_multisort排序函数 一. 手写arraysort PHP的一维数组排序函数: sort  对数组的值按 ...

  6. 剑指Offer-【面试题03:二维数组中的查找】

    package com.cxz.question3; /* * 在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序. * 请完成一个函数,输入这样的一个二维数组和 ...

  7. PHP开发笔记:二维数组根据某一项来进行排序

    比如说我们现在有一个二维数组: $arr = array( ‘d' => array(‘id' => 5, ‘name' => 1, ‘age' => 7), ‘b' => ...

  8. 剑指Offer面试题:2.二维数组中的查找

    一.题目:二维数组中的查找 题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. ...

  9. PHP 根据key 给二维数组分组

    我们经常拿到一个二维数组出来,会发现结果和自己想要的有些偏差,可能需要根据二维数组里的某个字段对数组分组.先来看以下数组, Array ( [0] => Array ( [id] => 1 ...

随机推荐

  1. 注册并启动 Reporting Services SharePoint 服务

    在安装 SharePoint 之前已安装 Reporting Services SharePoint 模式.所以Reporting Services SharePoint 是不能正常使用的. 安装完S ...

  2. 有关C#中使用if else和try catch的问题及效率问题

    本来if esle 是流程控制 try catch是异常处理,本身其实是没有可比性的,但是开发过程中有的人很容易混用,而且两者有的时候效果似乎一样,所以我还是用了个简单的测试来简单的比较下. 不多说, ...

  3. eclipse快捷键失效的解决办法

    今天敲html代码,突然发现ctrl+D不能用了,shift+enter/shift+ctrl+enter也不能用了,上网上搜了下,原来我是在文本模式下打开的.切换为html editor打开就o了. ...

  4. iOS Android图标生成器PHP

    <?php //修改为你想要的大小 //$sizes = array(16,29,32,36,48,50,57,58,72,76,96,100,114,120,128,144,152); $si ...

  5. HDU 1394 树状数组求逆序对

    Minimum Inversion Number Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java ...

  6. js用正则表达式控制价格输入

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <hea ...

  7. 长理ACM 14-星期几(谌海军)

    题目描述:编一个程序,已知今天是星期几,计算出n天后是星期几.要求使用枚举变量. 输入描述:输入为两个正整数,第一个数n(n<=6)表示今天是星期几,第二个数m(m<=1000),表示求m ...

  8. bitset常用函数用法记录 (转载)

    有些程序要处理二进制位的有序集,每个位可能包含的是0(关)或1(开)的值.位是用来保存一组项或条件的yes/no信息(有时也称标志)的简洁方法.标准库提供了bitset类使得处理位集合更容易一些.要使 ...

  9. OpenCV之响应鼠标(二):函数cvSetMouseCallback()和其副程式onMouse()的使用(OpenCV2.4.5)

    每當滑鼠在視訊視窗介面點擊一下的時候,都會有固定三個動作 1.點擊(Click) 2.放開(Down)3.滑動(move) 因此,程式執行滑鼠在點擊的時候onMouse()都會連續跑三次,代表滑鼠在點 ...

  10. java基础-001

    一.区分final . finally . finalize  1.关键字final Java语言的关键字final可以用于变量.类或方法,但是含义会有所不同. -用于变量:一旦初始化,变量值就不能修 ...