关于cuda拷贝的速度测试
由于没有使用profiler,仅仅通过简单的传输函数测试,如下测试了10000个点,1000000个点,100000000个点的速度:
均按时钟周期来计时,通过MAX调整数据
int main(){
    clock_t start,finish;
    int *d_data,*h_data;
    h_data = (int *)calloc(MAX, sizeof(int));
    memset(h_data,,MAX*sizeof(int));
    cudaMalloc((void **) &d_data,MAX*sizeof(int));
    start = clock();
    cudaMemcpy(d_data,h_data,MAX*sizeof(int),cudaMemcpyHostToDevice);
    cudaMemcpy(h_data,d_data,MAX*sizeof(int),cudaMemcpyDeviceToHost);
    finish = clock();
    cudaFree(d_data);
    free(h_data);
    cout<<"time is "<<finish-start<<endl;
    getchar();
return ;
}
测试结果
| 测试结果 | 10,000个节点 | 1,000,000个节点 | 100,000,000个节点 | 
| 第一次测试 | 0 | 7 | 822 | 
| 第二次测试 | 0 | 8 | 715 | 
| 第三次测试 | 1 | 7 | 696 | 
测试图表如下:

所以在小批量数组的情况下,完全可以在cpu中完成数据操作,然后device上面做简单的加和或者乘积运算。
关于cuda拷贝的速度测试的更多相关文章
- snprintf/strncpy/strlcpy速度测试
		
速度测试代码: #include <stdio.h> #include <stdlib.h> #include <string.h> #include <un ...
 - iOS5系统API和5个开源库的JSON解析速度测试
		
iOS5系统API和5个开源库的JSON解析速度测试 iOS5新增了JSON解析的API,我们将其和其他五个开源的JSON解析库进行了解析速度的测试,下面是测试的结果和工程代码附件. 我们选择的测试对 ...
 - TF卡速度测试对比 Class数越高速度越快
		
存储卡(TF卡)是手机扩展存储的大杀器,让你多装n部学习资料,多装n个外语听力练习.除了装东西外,存储卡性能不佳也会影响手机的整体性能以及体验的.本文主要针对Android手机,我是懒人,但我讨厌懒人 ...
 - 手机闪存速度测试工具,AndroBench
		
手机闪存速度测试工具,AndroBench
 - VPS性能测试(3):磁盘IO读写速度、SSD硬盘速度测试
		
1.磁盘IO,即输入/输出(Input/Output),这是测试磁盘性能一个重要指标,一些便宜的VPS主机为了降低成本,以大量的低性能的硬盘来充当服务器,导致VPS主机因为IO差而拖了整个主机性能的后 ...
 - 在线HTTP速度测试(响应时间测试)及浏览器兼容测试
		
一.前言 网站的响应时间,是判断一个网站是否是好网站的重要的因素之一.百度首页的响应时间在全国各个省份小于10ms.这个响应时间远远好于竞争对手.根据美丽说的技术负责人分析,美丽说访问速度提升10%, ...
 - Linux硬盘速度测试的命令
		
测试下硬盘的读写速度如何,在linux下可以使用hdparm 对硬盘进行测试或查看硬盘的相关信息. hdparm 命令进行硬盘速度测试.参数: -a 表示是否关闭磁盘预读取功能.对于大文件读取,这个显 ...
 - VPS速度测试(4):上传下载速度、服务器带宽、Ping响应时间
		
1.VPS的速度好坏经常是我们选择某一个VPS商家的重要参考指标,对于国外的VPS主机我们可以执行以下命令来测试VPS入口带宽是多少. wget https://cachefly.cachefly.n ...
 - StretchDIBits速度测试(HALFTONE)
		
StretchDIBits速度测试(HALFTONE) 下面实验中显示窗口大小为1024*768,拉伸模式设为HALFTONE. 一.单通道图像 (1) 保持图像高度为1024,宽度从24到2024递 ...
 
随机推荐
- 机器学习:SVM(scikit-learn 中的 SVM:LinearSVC)
			
一.基础理解 Hard Margin SVM 和 Soft Margin SVM 都是解决线性分类问题,无论是线性可分的问题,还是线性不可分的问题: 和 kNN 算法一样,使用 SVM 算法前,要对数 ...
 - Oracle RMAN 学习:恢复
			
Oracle RMAN 学习:恢复 6 rman恢复 Rman中的恢复对应restore,recover Restore,数据修复,利用备份集的数据文件来替换已损坏的数据文件或将其恢复到另外一个位置, ...
 - mybatis如何防止sql注入(1)
			
sql注入大家都不陌生,是一种常见的攻击方式,攻击者在界面的表单信息或url上输入一些奇怪的sql片段,例如“or ‘1’=‘1’”这样的语句,有可能入侵参数校验不足的应用程序.所以在我们的应用中需要 ...
 - 生产者与消费者---demo2---boke
			
假设有这样一种情况,有一个桌子,桌子上面有一个盘子,盘子里只能放一颗鸡蛋,A专门往盘子里放鸡蛋,如果盘子里有鸡蛋,则一直等到盘子里没鸡蛋,B专门从盘子里拿鸡蛋,如果盘子里没鸡蛋,则等待直到盘子里有鸡蛋 ...
 - SignalR推送服务在Android的实现 SignalA
			
SignalA是老外写的用于实现.net端推送消息至安卓端的实现,支持版本为android 2.3或以上,由于我的版本最低是2.2,所以只有把源码下下来自己改,如果你觉得太多了可自己编译成jar引用, ...
 - 第三章 Java内存模型(下)
			
锁的内存语义 中所周知,锁可以让临界区互斥执行.这里将介绍锁的另一个同样重要但常常被忽视的功能:锁的内存语义 锁的释放-获取建立的happens-before关系 锁是Java并发编程中最重要的同步机 ...
 - java 多线程系列---JUC原子类(一)之框架
			
根据修改的数据类型,可以将JUC包中的原子操作类可以分为4类. 1. 基本类型: AtomicInteger, AtomicLong, AtomicBoolean ;2. 数组类型: AtomicIn ...
 - WCF上传大文件处理方法
			
<system.serviceModel> <bindings> <basicHttpBind> <Binding name=" maxReceiv ...
 - secureCrt常用命令
			
一.常用命令: 1.ls 只列出文件名 (相当于dir,dir也可以使用) -A:列出所有文件,包含隐藏文件. -l:列表形式,包含文件的绝大部分属性. -R:递归显示. --help:此命令的帮助. ...
 - bzoj 2653 middle(主席树)
			
题面:https://vjudge.net/problem/HYSBZ-2653 博客:https://blog.csdn.net/litble/article/details/78984846 这个 ...