Release 模式

--------------------------------------------------
smooth gaussian : 2
cvtColor CV_BGR2Lab : 3
get_psnr : 16
convertTo CV_8U: 6
absdiff: 2
threshold: 0
dilate 20: 3
fill_hole : 3
bitwise_xor : 0
shape : 0
copyTo 3 channels : 0
select_color : 14
smooth median : 1
gen_bgra : 3
cal_color : 4
pic_mix : 22
110ms
--------------------------------------------------

smooth gaussian : 5

smooth median : 5

cvtColor CV_BGR2Lab : 3
accumulateWeighted : 11
convertTo CV_8U: 7
absdiff: 2
threshold: 0
dilate 20: 8
fill_hole : 1
bitwise_xor : 0

shape : 0

copyTo 3 channels : 0
select_color : 129
smooth median : 5
gen_bgra : 0
cal_color : 4
pic_mix : 23

gen_bgra : 3

all : 317ms

1.

float , int , char 的 加、乘、移位运算的耗时整理,   循环周期为 1000*1000*100

Debug模式:

int 加法:194
int 加两次:391
float 加法:1237
float 乘法:551

Release模式

int 加1次:35
int 加2次:37(分1个循环)

int 加2次:67 (2个循环)
float 加法:292
float 乘法:367

int型的加减乘除移位

右移8位 63ms           -----最高效

除以256 97ms

除以256.0 368ms

除以255 144ms

除以255.0 1165ms

32位和8位整形的运算时间大致相等---------所以用32位处理图像数据会更快。

i*7 和(i<<2) + (i<<1) + i 的时间大致相等,所以不需要把整形的乘法改为移位,但是一定要把整形的除法改为移位。

unsigned char [1920*1080]  分配内存 100 000次, 总耗时313ms

int [1920*1080]  分配内存 100 000次, 总耗时413ms

2.  opencv遍历Mat中的short数据

   for for   {   short * param = (short*)(res_map.data + sizeof(short)*of3);  }    耗时4ms (DEBUG模式)

  short * param = &((short*)res_map.data)[of3];   耗时4ms (DEBUG模式)  与上述相同

  Vec3s& param = res_map.at<Vec3s>(__j,__i);   耗时75 ms  (DEBUG模式)------大循环里千万不要用这种方式访问图像

short * param = &((short*)res_map.data)[of3];
short _index = param[0];
short _i = param[1];
short _j = param[2];

----耗时7ms

short * param = &((short*)res_map.data)[of3];
short& _index = param[0];
short& _i = param[1];
short& _j = param[2];

----short用引用耗时7ms

继续增加语句  int _of3 = (_j*wh+i)*3;  耗时8.4ms

继续增加语句 uchar* pixel = &mats[_index]->data[_of3];    ------31ms   麻痹的,大循环里千万不要对vector进行随机访问!!!

pixel 改成这种方法获取  uchar * pixel = &mats[_index].data[of3];     ---- 10ms

继续增加语句

res.data[of3] = pixel[0];
res.data[of3 + 1] = pixel[1];
res.data[of3 + 2] = pixel[2];
of3 += 3;

--------耗时20ms (DEBUG)

上述赋值方法改为

uchar * data = &res.data[of3];
data[0] = pixel[0];
data[1] = pixel[1];
data[2] = pixel[2];

--------耗时20ms (DEBUG)  耗时并未改变

改为

uchar * data = &res.data[of3];

memcpy( data,pixel,3 );  18.1ms

改为

uchar * data = &res.data[of3];

memcpy( data,pixel,4 );   ------18.2ms 耗时减少, 可能是由于拷贝的是32位数据的原因?

使用一个循环 for (int j = 0; j != size; ++j)     ----18.5ms    和上面一样, 并不能减少耗时

3. mix_pix   耗时:

3.1   耗时 36 ms

int _res_y = (fg_y*res_a + bg_y*_255_a)>>8;
int _res_cb = (fg_cb*res_a + bg_cb*_255_a) >> 8;
int _res_cr = (fg_cr*res_a + bg_cr*_255_a) >> 8;

3.2  耗时36 ms

int _res_y = (res_a*(fg_y - bg_y) >> 8) + bg_y;
int _res_cb = (res_a*(fg_cb - bg_cb) >> 8) + bg_cb;
int _res_cr = (res_a*(fg_cr - bg_cr) >> 8) + bg_cr;

3.3   注释mix_pix 代码  耗时  28ms

3.4 注释 mix_pix 函数里面的所有代码   29 ms

3.5 注释 int _res_y = (fg_y*res_a + bg_y*_255_a)>>8;    耗时 33ms

3.6 加CLAMP 比不加CLAMP 慢3-4 ms

4. convertT

  src.convertTo(src_16s, CV_16SC3);     1080片:  3 ms

  src.convertTo(src_16s, CV_32FC3);   6ms

    src.convertTo(src_16s, CV_32SC3);   6ms

  

opencv 一些函数的耗时计算的更多相关文章

  1. opencv-6-图像绘制与opencv Line 函数剖析

    opencv-6-图像绘制与opencv Line 函数剖析 opencvc++qt 开始之前 越到后面, 写的越慢, 之前还抽空去看了下 学堂在线那篇文章提供的方法, 博客第一个人评论的我, 想想还 ...

  2. Entity Framework 6 Recipes 2nd Edition(11-2)译 -> 为一个”模型定义”函数返回一个计算列

    11-3. 为一个”模型定义”函数返回一个计算列 问题 想从”模型定义”函数里返回一个计算列 解决方案 假设我们有一个员工(Employee)实体,属性有: FirstName, LastName,和 ...

  3. opencv 霍夫变换 实现图片旋转角度计算

    在OCR实际开发中,证件照采集角度有很大的偏差,需要将图片进行旋转校正, 效果图: 在应用中发现应该加入高斯模糊,可以极大减少误差线条. 知道线条后 通过求斜率 得旋转角度 .(x1-x2)/(y1- ...

  4. C/C++多参数函数参数的计算顺序与压栈顺序

    一.前言 今天在看Thinking in C++这本书时,书中的一个例子引起了我的注意,具体是使用了下面这句 单看这条语句的语义会发现仅仅是使用一个简单的string的substr函数将所得子串pus ...

  5. Numpy.frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数

    Numpy.frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数 不再通过遍历,对数组中的元素进行运算,利用frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数 ...

  6. 【记录一个问题】macos下lldb调试opencv的一个程序,出现“failed to load objfile for”错误,并且无法调试进入opencv的函数

    opencv编译使用了Debug版本,打开了BUILD_WITH_DEBUG_INFO=ON选项. 发现问题后,我又在CMAKE_CXX_FLAGS_DEBUG中设置为 -g -ggdb3,在CMAK ...

  7. Golang记录、计算函数执行耗时、运行时间的一个简单方法

    // 写超时警告日志 通用方法   func TimeoutWarning(tag, detailed string, start time.Time, timeLimit float64) {    ...

  8. 【麦子学院】OpenCV教程函数总结

    个自带样例. parter 1: No1. adaptiveskindetector.cpp 利用HSV空间的色调信息的皮肤检測,背景不能有太多与肤色相似的颜色.效果不是特别好. No2. bagof ...

  9. opencv ---getRotationMatrix2D函数

    getRotationMatrix2D函数 主要用于获得图像绕着 某一点的旋转矩阵  Mat getRotationMatrix2D(Point2f center, double angle, dou ...

随机推荐

  1. CSS 背景色变化 结构化伪类的练习

    CSS3的nth-child() 选择器(兼容性不好),在做表格偶数行变色的时候,我通常在绑定的时候,做一个js判断,来加一个css,从而使表格偶数行和奇数行颜色不一样.这样的兼容性很好. 但是最近在 ...

  2. 使用AOP思想封装JDBC

    看代码 package learning.aop2; import org.springframework.stereotype.Component; import java.sql.SQLExcep ...

  3. Python AES加密

    使用pycrypto模块https://pypi.python.org/pypi/pycrypto/ >>> from Crypto.Cipher import AES>> ...

  4. c++空类为什么占用1个字符

    在C++中空类会占一个字节,这是为了让对象的实例能够相互区别.具体来说,空类同样可以被实例化,并且每个实例在内存中都有独一无二的地址,因此,编译器会给空类隐含加上一个字节,这样空类实例化之后就会拥有独 ...

  5. playbook部署coredns

    playbook部署coredns 说明test1是主控节点,目的是给test4 node节点安装coredns, 1.coredns-1.2.2.tar.gz安装包放到主控节点/server/sof ...

  6. Java类的加载及初始化

    每个类的编译代码都存在于它自己的独立文件中,该文件在需要使用该程序代码时才会被加载.通常有以下三种加载情况: (1) 访问了子类的静态变量或静态方法:仅对类的静态变量,静态块执行初始化操作,并仅初始化 ...

  7. springcloud随便写点

    eureka  注册注册 ribbon 负载均衡 feign  声名式client hystrix  断路器 zuul  网关,智能路由,过滤 config 集群配置 bus 分布式的节点用轻量的消息 ...

  8. Python3 Selenium自动化web测试 ==> 第七节 WebDriver高级应用 -- 浮动框中,单击选择某个关键字选项

    学习目的: 了解WebDriver的高级应用 正式步骤: 测试Python3代码 # -*- coding:utf-8 -*- from selenium import webdriver from ...

  9. 模型蒸馏(Distil)及mnist实践

    结论:蒸馏是个好方法. 模型压缩/蒸馏在论文<Model Compression>及<Distilling the Knowledge in a Neural Network> ...

  10. 【VS开发】CreateThread给线程函数传递的参数

    CreateThread给线程函数传递的参数   HANDLE WINAPI CreateThread ( __in_opt LPSECURITY_ATTRIBUTES lpThreadAttribu ...