Introduction

I am going to measure the performence of my two GT650M and compare GPU with CPU version.

code segments

#include <iostream>
#include <omp.h>
using namespace std;

#include <cuda_runtime.h>

#include <opencv2/opencv.hpp>
#include <opencv2/gpu/gpu.hpp>
using namespace cv;

#define TB__(A) int64 A; A = cv::getTickCount()
#define TE__(A) cout << #A << " : " << 1.E3 * double(cv::getTickCount() - A)/double(cv::getTickFrequency()) << "ms" << endl

Vec3b max(cv::Mat &A, cv::Mat &B){
    int width = A.cols;
    int height = A.rows;
    Vec3b me(0,0,0);
    for (int y = 0; y < height; y++){
        for (int x = 0; x < width; x++){
            Vec3b p0 = A.at<Vec3b>(y,x);
            Vec3b p1 = B.at<Vec3b>(y,x);
            Vec3b pixel;
            pixel[0] = p1[0]>p0[0]? p1[0]-p0[0]:p0[0]-p1[0];
            pixel[1] = p1[1]>p0[1]? p1[1]-p0[1]:p0[1]-p1[1];
            pixel[2] = p1[2]>p0[2]? p1[2]-p0[2]:p0[2]-p1[2];
            if (me[0] < pixel[0])
                me[0] = pixel[0];
            if (me[1] < pixel[1])
                me[1] = pixel[1];
            if (me[2] < pixel[2])
                me[2] = pixel[2];
        }
    }
    return me;
}

#define REPEATES 10000

int main(){
  // please ensure that you have at least two Nvidia GPUs on your mathorboad.
    cv::Mat cpu_src = imread("86.jpg");
    cv::Mat cpu_dst;

    cv::Mat gpu_dst[2];

    TB__(cpu_cvt);
#pragma omp parallel for num_threads(4)
    for (int k = 0; k < REPEATES; k++)
        cv::cvtColor(cpu_src, cpu_dst, CV_BGR2Lab);
    TE__(cpu_cvt);

    TB__(gpu_cvt);
#pragma omp parallel num_threads(2)
    {
        int id = omp_get_thread_num();
        cv::gpu::setDevice(id);

        cv::gpu::GpuMat dev_src;
        cv::gpu::GpuMat dev_dst;

        dev_src.upload(cpu_src);

        //#pragma omp master
        //TB__(gpu_omp_dev);

        #pragma omp for
        for (int k = 0; k < REPEATES; k++){
            dev_src.upload(cpu_src);
            cv::gpu::cvtColor(dev_src, dev_dst, CV_BGR2Lab);
            dev_dst.download(gpu_dst[id]);
        }
        cudaDeviceSynchronize();
    }
    TE__(gpu_cvt);

  cout << cv::sum(cpu_dst - gpu_dst[0]) << endl;
  cout << cv::sum(cpu_dst - gpu_dst[1]) << endl;
  cout << cv::sum(gpu_dst[0] - gpu_dst[1]) << endl;

    cout << endl;

  cout << max(cpu_dst, gpu_dst[0]) << endl;
  cout << max(cpu_dst, gpu_dst[1]) << endl;
    return 0;
}

[OpenCV] GpuMat and Mat, compare cvtColor perforemence的更多相关文章

  1. opencv学习之颜色空间转换cvtColor()

    我们生活中大多数看到的彩色图片都是RGB类型,但是在进行图像处理时,需要用到灰度图.二值图.HSV.HSI等颜色制式,opencv提供了cvtColor()函数来实现这些功能.首先看一下cvtColo ...

  2. OpenCV不同类型Mat的at方法访问元素时该如何确定模板函数的typename(转)

    自从OpenCV推出了Mat后越来越像是Matlab了,使用起来方便了很多,但是,在用at方法访问Mat时,如何选用合适的typename类型来访问相应的Mat元素是个头疼的问题. 比如: int H ...

  3. OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解

    原文:OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解 Title : cv::Mat depth/dims/channels ...

  4. Visual Studio 控制台应用程序 同时使用OpenCV和matlab mat文件操作

    matalb具有灵活的图像处理,代码编写起来简洁而高效.而OpenCV具有很多成熟的计算机视觉算法,能够处理很多实时的识别处理等问题,而且代码运行起来效率很高.所以如何结合两者之间的优点,是让很多学术 ...

  5. 【编程开发】opencv实现对Mat中某一列或某一行的元素进行normalization

    [编程开发]opencv实现对Mat中某一列或某一行的元素进行normalization 标签: [编程开发] [机器学习] 声明:引用请注明出处http://blog.csdn.net/lg1259 ...

  6. 第二章:Opencv核心類Mat

    Opecv就是做計算機視覺,就是讲图片转换成计算机所能识别的数据 Mat类中由大量的内联函数,主要就是用于提高速度. 一般类型都用rgb,存的时候用CV_8UC3.create函数一般会把原来的空间释 ...

  7. opencv yuv420与Mat互转

    项目用到opencv 融合图片的功能,经过一天的调试,达到预期目标,先将如何调用opencv库实现YUV42与Mat互转记录下来. 一.下载opencv编译的库下载地址是:http://opencv. ...

  8. opencv中的Mat类型

    Mat类型主要是跟matlab中的数据类型一样.故用起来很方便. Mat最大的优势跟STL很相似,都是对内存进行动态的管理,不需要之前用户手动的管理内存,对于一些大型的开发,有时候投入的lpImage ...

  9. OpenCV教程二 - Mat对象与它各种用法

    学习OpenCV大家都会遇到一个对象叫做Mat,此对象非常神奇,支持各种操作.很多初学者因此被搞得头晕脑胀,它各种用法太多太杂,搞得初学者应接不暇,感觉有心无力.无处下手之感.这里我们首先要正本清源, ...

随机推荐

  1. 最短路径之Dijkstra算法

    Dijkstra(迪杰斯特拉)算法是典型的最短路径路由算法,用于计算一个节点到其他所有节点的最短路径.主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止.Dijkstra算法能得出最短路径的最优 ...

  2. Windows使用Gitblit搭建Git服务器

    安装之前需确定安装JAVA运行环境. 下载安装 首先到 Gitblit官网 下载安装包.此处使用的版本是1.8.0. 将解压得到的gitblit-1.8.0文件夹放于C:\gitServer目录下. ...

  3. spring加载xml的六种方式

    因为目前正在从事一个项目,项目中一个需求就是所有的功能都是插件的形式装入系统,这就需要利用Spring去动态加载某一位置下的配置文件,所以就总结了下Spring中加载xml配置文件的方式,我总结的有6 ...

  4. 最新版Charles破解方法(Mac+Windows).md

    Charles 破解 去网站 http://charles.iiilab.com/ 下载相对应的版本 下载破解文件 charles.jar http://charles.iiilab.com/ 替换掉 ...

  5. Discuz!另一处SSRF无须登陆无须条件

    漏洞来源:http://wooyun.jozxing.cc/static/bugs/wooyun-2015-0151179.html 看看poc:http://phpstudy.com/Discuz_ ...

  6. Codeforces Round #438 C. Qualification Rounds

    Description Snark and Philip are preparing the problemset for the upcoming pre-qualification round f ...

  7. bzoj 3174: [Tjoi2013]拯救小矮人

    Description 一群小矮人掉进了一个很深的陷阱里,由于太矮爬不上来,于是他们决定搭一个人梯.即:一个小矮人站在另一小矮人的 肩膀上,知道最顶端的小矮人伸直胳膊可以碰到陷阱口.对于每一个小矮人, ...

  8. bzoj3198[Sdoi2013]spring 容斥+hash

    3198: [Sdoi2013]spring Time Limit: 40 Sec  Memory Limit: 256 MBSubmit: 1143  Solved: 366[Submit][Sta ...

  9. bzoj2839: 集合计数 容斥+组合

    2839: 集合计数 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 523  Solved: 287[Submit][Status][Discuss] ...

  10. Visual Studio 2015 无法命中断点

    新安装操作系统后发现,vs2015无法命中断点. 在项目中设置生成调试信息:FULL   即可.