Introduction

I am going to measure the performence of my two GT650M and compare GPU with CPU version.

code segments

#include <iostream>
#include <omp.h>
using namespace std;

#include <cuda_runtime.h>

#include <opencv2/opencv.hpp>
#include <opencv2/gpu/gpu.hpp>
using namespace cv;

#define TB__(A) int64 A; A = cv::getTickCount()
#define TE__(A) cout << #A << " : " << 1.E3 * double(cv::getTickCount() - A)/double(cv::getTickFrequency()) << "ms" << endl

Vec3b max(cv::Mat &A, cv::Mat &B){
    int width = A.cols;
    int height = A.rows;
    Vec3b me(0,0,0);
    for (int y = 0; y < height; y++){
        for (int x = 0; x < width; x++){
            Vec3b p0 = A.at<Vec3b>(y,x);
            Vec3b p1 = B.at<Vec3b>(y,x);
            Vec3b pixel;
            pixel[0] = p1[0]>p0[0]? p1[0]-p0[0]:p0[0]-p1[0];
            pixel[1] = p1[1]>p0[1]? p1[1]-p0[1]:p0[1]-p1[1];
            pixel[2] = p1[2]>p0[2]? p1[2]-p0[2]:p0[2]-p1[2];
            if (me[0] < pixel[0])
                me[0] = pixel[0];
            if (me[1] < pixel[1])
                me[1] = pixel[1];
            if (me[2] < pixel[2])
                me[2] = pixel[2];
        }
    }
    return me;
}

#define REPEATES 10000

int main(){
  // please ensure that you have at least two Nvidia GPUs on your mathorboad.
    cv::Mat cpu_src = imread("86.jpg");
    cv::Mat cpu_dst;

    cv::Mat gpu_dst[2];

    TB__(cpu_cvt);
#pragma omp parallel for num_threads(4)
    for (int k = 0; k < REPEATES; k++)
        cv::cvtColor(cpu_src, cpu_dst, CV_BGR2Lab);
    TE__(cpu_cvt);

    TB__(gpu_cvt);
#pragma omp parallel num_threads(2)
    {
        int id = omp_get_thread_num();
        cv::gpu::setDevice(id);

        cv::gpu::GpuMat dev_src;
        cv::gpu::GpuMat dev_dst;

        dev_src.upload(cpu_src);

        //#pragma omp master
        //TB__(gpu_omp_dev);

        #pragma omp for
        for (int k = 0; k < REPEATES; k++){
            dev_src.upload(cpu_src);
            cv::gpu::cvtColor(dev_src, dev_dst, CV_BGR2Lab);
            dev_dst.download(gpu_dst[id]);
        }
        cudaDeviceSynchronize();
    }
    TE__(gpu_cvt);

  cout << cv::sum(cpu_dst - gpu_dst[0]) << endl;
  cout << cv::sum(cpu_dst - gpu_dst[1]) << endl;
  cout << cv::sum(gpu_dst[0] - gpu_dst[1]) << endl;

    cout << endl;

  cout << max(cpu_dst, gpu_dst[0]) << endl;
  cout << max(cpu_dst, gpu_dst[1]) << endl;
    return 0;
}

[OpenCV] GpuMat and Mat, compare cvtColor perforemence的更多相关文章

  1. opencv学习之颜色空间转换cvtColor()

    我们生活中大多数看到的彩色图片都是RGB类型,但是在进行图像处理时,需要用到灰度图.二值图.HSV.HSI等颜色制式,opencv提供了cvtColor()函数来实现这些功能.首先看一下cvtColo ...

  2. OpenCV不同类型Mat的at方法访问元素时该如何确定模板函数的typename(转)

    自从OpenCV推出了Mat后越来越像是Matlab了,使用起来方便了很多,但是,在用at方法访问Mat时,如何选用合适的typename类型来访问相应的Mat元素是个头疼的问题. 比如: int H ...

  3. OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解

    原文:OpenCV中对Mat里面depth,dims,channels,step,data,elemSize和数据地址计算的理解 Title : cv::Mat depth/dims/channels ...

  4. Visual Studio 控制台应用程序 同时使用OpenCV和matlab mat文件操作

    matalb具有灵活的图像处理,代码编写起来简洁而高效.而OpenCV具有很多成熟的计算机视觉算法,能够处理很多实时的识别处理等问题,而且代码运行起来效率很高.所以如何结合两者之间的优点,是让很多学术 ...

  5. 【编程开发】opencv实现对Mat中某一列或某一行的元素进行normalization

    [编程开发]opencv实现对Mat中某一列或某一行的元素进行normalization 标签: [编程开发] [机器学习] 声明:引用请注明出处http://blog.csdn.net/lg1259 ...

  6. 第二章:Opencv核心類Mat

    Opecv就是做計算機視覺,就是讲图片转换成计算机所能识别的数据 Mat类中由大量的内联函数,主要就是用于提高速度. 一般类型都用rgb,存的时候用CV_8UC3.create函数一般会把原来的空间释 ...

  7. opencv yuv420与Mat互转

    项目用到opencv 融合图片的功能,经过一天的调试,达到预期目标,先将如何调用opencv库实现YUV42与Mat互转记录下来. 一.下载opencv编译的库下载地址是:http://opencv. ...

  8. opencv中的Mat类型

    Mat类型主要是跟matlab中的数据类型一样.故用起来很方便. Mat最大的优势跟STL很相似,都是对内存进行动态的管理,不需要之前用户手动的管理内存,对于一些大型的开发,有时候投入的lpImage ...

  9. OpenCV教程二 - Mat对象与它各种用法

    学习OpenCV大家都会遇到一个对象叫做Mat,此对象非常神奇,支持各种操作.很多初学者因此被搞得头晕脑胀,它各种用法太多太杂,搞得初学者应接不暇,感觉有心无力.无处下手之感.这里我们首先要正本清源, ...

随机推荐

  1. JAVA_扫雷游戏(布置地雷)

    1.要为扫雷游戏布置地雷,扫雷游戏的扫雷面板可以用二维int数组表示.如某位置为地雷,则该位置用数字-1表示, 如该位置不是地雷,则暂时用数字0表示. 编写程序完成在该二维数组中随机布雷的操作,程序读 ...

  2. oracle11.2中分区功能测试之add&amp;split partition对global&amp;local index的影响

    生产库中某些大表的分区异常,需要对现有表进行在线操作,以添加丢失分区,因为是生产库,还是谨慎点好,今天有空,针对add&split分区对global&local索引的影响进行了测试,测 ...

  3. C#之winform实现文件拖拽功能

    将一个文件拖拽到窗体的某个控件时,将该控件的路径显示在该控件上,只要拿到了路径自然可以读取文件中的内容了 将一个控件的属性AllowDrop设置为true,然后添加DragDrop.DragEnter ...

  4. C#生成MD5码

    /// <summary> /// 获取文件的MD5码 /// </summary> /// <param name="fileName">传入 ...

  5. [LeetCode] Valid Square 验证正方形

    Given the coordinates of four points in 2D space, return whether the four points could construct a s ...

  6. [LeetCode] Number Complement 补数

    Given a positive integer, output its complement number. The complement strategy is to flip the bits ...

  7. Anaconda入门安装教程

    Anaconda 是什么? Anaconda 是一个可用于科学计算的 Python 发行版,支持 Linux.Mac.Windows系统,内置了常用的科学计算包.它解决了官方 Python 的两大痛点 ...

  8. [NOIp 2015]斗地主

    Description 牛牛最近迷上了一种叫斗地主的扑克游戏.斗地主是一种使用黑桃.红心.梅花.方片的A到K加上大小王的共54张牌来进行的扑克牌游戏.在斗地主中,牌的大小关系根据牌的数码表示如下:3& ...

  9. [SDOI2016]排列计数

    Description 求有多少种长度为 n 的序列 A,满足以下条件: 1 ~ n 这 n 个数在序列中各出现了一次 若第 i 个数 A[i] 的值为 i,则称 i 是稳定的.序列恰好有 m 个数是 ...

  10. 数轴line

    aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAq8AAAGaCAYAAAAhPqoeAAAgAElEQVR4nOzdCbh2U/k/8C0NpkgRzZ