Introduction

I am going to measure the performence of my two GT650M and compare GPU with CPU version.

code segments

#include <iostream>
#include <omp.h>
using namespace std;

#include <cuda_runtime.h>

#include <opencv2/opencv.hpp>
#include <opencv2/gpu/gpu.hpp>
using namespace cv;

#define TB__(A) int64 A; A = cv::getTickCount()
#define TE__(A) cout << #A << " : " << 1.E3 * double(cv::getTickCount() - A)/double(cv::getTickFrequency()) << "ms" << endl

Vec3b max(cv::Mat &A, cv::Mat &B){
    int width = A.cols;
    int height = A.rows;
    Vec3b me(0,0,0);
    for (int y = 0; y < height; y++){
        for (int x = 0; x < width; x++){
            Vec3b p0 = A.at<Vec3b>(y,x);
            Vec3b p1 = B.at<Vec3b>(y,x);
            Vec3b pixel;
            pixel[0] = p1[0]>p0[0]? p1[0]-p0[0]:p0[0]-p1[0];
            pixel[1] = p1[1]>p0[1]? p1[1]-p0[1]:p0[1]-p1[1];
            pixel[2] = p1[2]>p0[2]? p1[2]-p0[2]:p0[2]-p1[2];
            if (me[0] < pixel[0])
                me[0] = pixel[0];
            if (me[1] < pixel[1])
                me[1] = pixel[1];
            if (me[2] < pixel[2])
                me[2] = pixel[2];
        }
    }
    return me;
}

#define REPEATES 10000

int main(){
  // please ensure that you have at least two Nvidia GPUs on your mathorboad.
    cv::Mat cpu_src = imread("86.jpg");
    cv::Mat cpu_dst;

    cv::Mat gpu_dst[2];

    TB__(cpu_cvt);
#pragma omp parallel for num_threads(4)
    for (int k = 0; k < REPEATES; k++)
        cv::cvtColor(cpu_src, cpu_dst, CV_BGR2Lab);
    TE__(cpu_cvt);

    TB__(gpu_cvt);
#pragma omp parallel num_threads(2)
    {
        int id = omp_get_thread_num();
        cv::gpu::setDevice(id);

        cv::gpu::GpuMat dev_src;
        cv::gpu::GpuMat dev_dst;

        dev_src.upload(cpu_src);

        //#pragma omp master
        //TB__(gpu_omp_dev);

        #pragma omp for
        for (int k = 0; k < REPEATES; k++){
            dev_src.upload(cpu_src);
            cv::gpu::cvtColor(dev_src, dev_dst, CV_BGR2Lab);
            dev_dst.download(gpu_dst[id]);
        }
        cudaDeviceSynchronize();
    }
    TE__(gpu_cvt);

  cout << cv::sum(cpu_dst - gpu_dst[0]) << endl;
  cout << cv::sum(cpu_dst - gpu_dst[1]) << endl;
  cout << cv::sum(gpu_dst[0] - gpu_dst[1]) << endl;

    cout << endl;

  cout << max(cpu_dst, gpu_dst[0]) << endl;
  cout << max(cpu_dst, gpu_dst[1]) << endl;
    return 0;
}

[OpenCV] GpuMat and Mat, compare cvtColor perforemence的更多相关文章

  1. opencv学习之颜色空间转换cvtColor()

    我们生活中大多数看到的彩色图片都是RGB类型,但是在进行图像处理时,需要用到灰度图.二值图.HSV.HSI等颜色制式,opencv提供了cvtColor()函数来实现这些功能.首先看一下cvtColo ...

  2. OpenCV不同类型Mat的at方法访问元素时该如何确定模板函数的typename(转)

    自从OpenCV推出了Mat后越来越像是Matlab了,使用起来方便了很多,但是,在用at方法访问Mat时,如何选用合适的typename类型来访问相应的Mat元素是个头疼的问题. 比如: int H ...

  3. OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解

    原文:OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解 Title : cv::Mat depth/dims/channels ...

  4. Visual Studio 控制台应用程序 同时使用OpenCV和matlab mat文件操作

    matalb具有灵活的图像处理,代码编写起来简洁而高效.而OpenCV具有很多成熟的计算机视觉算法,能够处理很多实时的识别处理等问题,而且代码运行起来效率很高.所以如何结合两者之间的优点,是让很多学术 ...

  5. 【编程开发】opencv实现对Mat中某一列或某一行的元素进行normalization

    [编程开发]opencv实现对Mat中某一列或某一行的元素进行normalization 标签: [编程开发] [机器学习] 声明:引用请注明出处http://blog.csdn.net/lg1259 ...

  6. 第二章:Opencv核心類Mat

    Opecv就是做計算機視覺,就是讲图片转换成计算机所能识别的数据 Mat类中由大量的内联函数,主要就是用于提高速度. 一般类型都用rgb,存的时候用CV_8UC3.create函数一般会把原来的空间释 ...

  7. opencv yuv420与Mat互转

    项目用到opencv 融合图片的功能,经过一天的调试,达到预期目标,先将如何调用opencv库实现YUV42与Mat互转记录下来. 一.下载opencv编译的库下载地址是:http://opencv. ...

  8. opencv中的Mat类型

    Mat类型主要是跟matlab中的数据类型一样.故用起来很方便. Mat最大的优势跟STL很相似,都是对内存进行动态的管理,不需要之前用户手动的管理内存,对于一些大型的开发,有时候投入的lpImage ...

  9. OpenCV教程二 - Mat对象与它各种用法

    学习OpenCV大家都会遇到一个对象叫做Mat,此对象非常神奇,支持各种操作.很多初学者因此被搞得头晕脑胀,它各种用法太多太杂,搞得初学者应接不暇,感觉有心无力.无处下手之感.这里我们首先要正本清源, ...

随机推荐

  1. React 深入系列3:Props 和 State

    文:徐超,<React进阶之路>作者 授权发布,转载请注明作者及出处 React 深入系列3:Props 和 State React 深入系列,深入讲解了React中的重点概念.特性和模式 ...

  2. golang如何使用channel控制goroutine退出

    最经典的处理方式: 在启动goroutine的时候,传递一个额外的chan型参数,用来接收退出信号,代码如下 func worker(name string, stopchan chan struct ...

  3. ●BZOJ 2002 [Hnoi2010]Bounce 弹飞绵羊

    题链: http://www.lydsy.com/JudgeOnline/problem.php?id=2002 题解: LCT 如果把弹跳的起点和终点连一条边,弹出去的与n+1号点连边, 则不难发现 ...

  4. [BZOJ]1177: [Apio2009]Oil

    题目大意:给出一个n*m的矩阵,选出3个不相交的k*k子矩阵,使得子矩阵中元素和最大.(k<=n,m<=1500) 思路:选出的子矩阵有3种情况:横着排三个.竖着排三个.三角状分布(其中有 ...

  5. 2015 多校联赛 ——HDU5319(模拟)

    Painter Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) Total Su ...

  6. 2015 多校联赛 ——HDU5289(二分+ST)

    Assignment Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) Total ...

  7. 习题9-3 UVA1629(dp)

    Cake Slicing 题意:有一个n行m列的网格上有一些黑点,要求进行切割,使最后每块上只有一个黑点,求最少的刀数 思路:记忆化搜索,枚举每一条边来切,每一次搜索自己所能切割的所有情况取最小值 但 ...

  8. bzoj2811[Apio2012]Guard 贪心

    2811: [Apio2012]Guard Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 905  Solved: 387[Submit][Statu ...

  9. Android技术分享-文字转语音并朗读

    Android技术分享-文字转语音并朗读 最近在做一个项目,其中有一个功能是需要将文本转换成语音并播放出来.下面我将我的做法分享一下. 非常令人开心的是,Android系统目前已经集成了TTS,提供了 ...

  10. C++多态实现原理

    C++的多态性用一句话概括就是:在基类的函数前加上virtual关键字,在派生类中重写该函数,运行时将会根据对象的实际类型来调用相应的函数.如果对象类型是派生类,就调用派生类的函数:如果对象类型是基类 ...