opencv 一些函数的耗时计算
Release 模式
--------------------------------------------------
smooth gaussian : 2
cvtColor CV_BGR2Lab : 3
get_psnr : 16
convertTo CV_8U: 6
absdiff: 2
threshold: 0
dilate 20: 3
fill_hole : 3
bitwise_xor : 0
shape : 0
copyTo 3 channels : 0
select_color : 14
smooth median : 1
gen_bgra : 3
cal_color : 4
pic_mix : 22
110ms
--------------------------------------------------
smooth gaussian : 5
smooth median : 5
cvtColor CV_BGR2Lab : 3
accumulateWeighted : 11
convertTo CV_8U: 7
absdiff: 2
threshold: 0
dilate 20: 8
fill_hole : 1
bitwise_xor : 0
shape : 0
copyTo 3 channels : 0
select_color : 129
smooth median : 5
gen_bgra : 0
cal_color : 4
pic_mix : 23
gen_bgra : 3
all : 317ms
1.
float , int , char 的 加、乘、移位运算的耗时整理, 循环周期为 1000*1000*100
Debug模式:
int 加法:194
int 加两次:391
float 加法:1237
float 乘法:551
Release模式
int 加1次:35
int 加2次:37(分1个循环)
int 加2次:67 (2个循环)
float 加法:292
float 乘法:367
int型的加减乘除移位
右移8位 63ms -----最高效
除以256 97ms
除以256.0 368ms
除以255 144ms
除以255.0 1165ms
32位和8位整形的运算时间大致相等---------所以用32位处理图像数据会更快。
i*7 和(i<<2) + (i<<1) + i 的时间大致相等,所以不需要把整形的乘法改为移位,但是一定要把整形的除法改为移位。
unsigned char [1920*1080] 分配内存 100 000次, 总耗时313ms
int [1920*1080] 分配内存 100 000次, 总耗时413ms
2. opencv遍历Mat中的short数据
for for { short * param = (short*)(res_map.data + sizeof(short)*of3); } 耗时4ms (DEBUG模式)
short * param = &((short*)res_map.data)[of3]; 耗时4ms (DEBUG模式) 与上述相同
Vec3s& param = res_map.at<Vec3s>(__j,__i); 耗时75 ms (DEBUG模式)------大循环里千万不要用这种方式访问图像
short * param = &((short*)res_map.data)[of3];
short _index = param[0];
short _i = param[1];
short _j = param[2];
----耗时7ms
short * param = &((short*)res_map.data)[of3];
short& _index = param[0];
short& _i = param[1];
short& _j = param[2];
----short用引用耗时7ms
继续增加语句 int _of3 = (_j*wh+i)*3; 耗时8.4ms
继续增加语句 uchar* pixel = &mats[_index]->data[_of3]; ------31ms 麻痹的,大循环里千万不要对vector进行随机访问!!!
pixel 改成这种方法获取 uchar * pixel = &mats[_index].data[of3]; ---- 10ms
继续增加语句
res.data[of3] = pixel[0];
res.data[of3 + 1] = pixel[1];
res.data[of3 + 2] = pixel[2];
of3 += 3;
--------耗时20ms (DEBUG)
上述赋值方法改为
uchar * data = &res.data[of3];
data[0] = pixel[0];
data[1] = pixel[1];
data[2] = pixel[2];
--------耗时20ms (DEBUG) 耗时并未改变
改为
uchar * data = &res.data[of3];
memcpy( data,pixel,3 ); 18.1ms
改为
uchar * data = &res.data[of3];
memcpy( data,pixel,4 ); ------18.2ms 耗时减少, 可能是由于拷贝的是32位数据的原因?
使用一个循环 for (int j = 0; j != size; ++j) ----18.5ms 和上面一样, 并不能减少耗时
3. mix_pix 耗时:
3.1 耗时 36 ms
int _res_y = (fg_y*res_a + bg_y*_255_a)>>8;
int _res_cb = (fg_cb*res_a + bg_cb*_255_a) >> 8;
int _res_cr = (fg_cr*res_a + bg_cr*_255_a) >> 8;
3.2 耗时36 ms
int _res_y = (res_a*(fg_y - bg_y) >> 8) + bg_y;
int _res_cb = (res_a*(fg_cb - bg_cb) >> 8) + bg_cb;
int _res_cr = (res_a*(fg_cr - bg_cr) >> 8) + bg_cr;
3.3 注释mix_pix 代码 耗时 28ms
3.4 注释 mix_pix 函数里面的所有代码 29 ms
3.5 注释 int _res_y = (fg_y*res_a + bg_y*_255_a)>>8; 耗时 33ms
3.6 加CLAMP 比不加CLAMP 慢3-4 ms
4. convertT
src.convertTo(src_16s, CV_16SC3); 1080片: 3 ms
src.convertTo(src_16s, CV_32FC3); 6ms
src.convertTo(src_16s, CV_32SC3); 6ms
opencv 一些函数的耗时计算的更多相关文章
- opencv-6-图像绘制与opencv Line 函数剖析
opencv-6-图像绘制与opencv Line 函数剖析 opencvc++qt 开始之前 越到后面, 写的越慢, 之前还抽空去看了下 学堂在线那篇文章提供的方法, 博客第一个人评论的我, 想想还 ...
- Entity Framework 6 Recipes 2nd Edition(11-2)译 -> 为一个”模型定义”函数返回一个计算列
11-3. 为一个”模型定义”函数返回一个计算列 问题 想从”模型定义”函数里返回一个计算列 解决方案 假设我们有一个员工(Employee)实体,属性有: FirstName, LastName,和 ...
- opencv 霍夫变换 实现图片旋转角度计算
在OCR实际开发中,证件照采集角度有很大的偏差,需要将图片进行旋转校正, 效果图: 在应用中发现应该加入高斯模糊,可以极大减少误差线条. 知道线条后 通过求斜率 得旋转角度 .(x1-x2)/(y1- ...
- C/C++多参数函数参数的计算顺序与压栈顺序
一.前言 今天在看Thinking in C++这本书时,书中的一个例子引起了我的注意,具体是使用了下面这句 单看这条语句的语义会发现仅仅是使用一个简单的string的substr函数将所得子串pus ...
- Numpy.frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数
Numpy.frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数 不再通过遍历,对数组中的元素进行运算,利用frompyfunc()将计算单个值的函数转化为计算数组中每个元素的函数 ...
- 【记录一个问题】macos下lldb调试opencv的一个程序,出现“failed to load objfile for”错误,并且无法调试进入opencv的函数
opencv编译使用了Debug版本,打开了BUILD_WITH_DEBUG_INFO=ON选项. 发现问题后,我又在CMAKE_CXX_FLAGS_DEBUG中设置为 -g -ggdb3,在CMAK ...
- Golang记录、计算函数执行耗时、运行时间的一个简单方法
// 写超时警告日志 通用方法 func TimeoutWarning(tag, detailed string, start time.Time, timeLimit float64) { ...
- 【麦子学院】OpenCV教程函数总结
个自带样例. parter 1: No1. adaptiveskindetector.cpp 利用HSV空间的色调信息的皮肤检測,背景不能有太多与肤色相似的颜色.效果不是特别好. No2. bagof ...
- opencv ---getRotationMatrix2D函数
getRotationMatrix2D函数 主要用于获得图像绕着 某一点的旋转矩阵 Mat getRotationMatrix2D(Point2f center, double angle, dou ...
随机推荐
- 一次galera cluster集群故障节点无法启动问题排查
现象 环境: Server version: 10.0.25-MariaDB-wsrep MariaDB Server, wsrep_25.13.raf7f02e 配置文件: [root@node-2 ...
- rally测试opentack------安装部署和简单实践
1,下载 git clone git://git.openstack.org/openstack/rally 或者 git clone https://git.openstack.org/openst ...
- OriginPro 9.1 科研图标绘制入门
OriginPro 9.1 科研图标绘制入门 目的:1.介绍如何不用编程画出复杂多样的图表2.介绍OriginLab 常用功能3.科研报告时,有效绘图,省却时间 科研发展需求.反映专业形象.满足公司要 ...
- python之scrapy模拟登陆人人网
1.settings.py主要配置信息,包括USER_AGENT等 # -*- coding: utf-8 -*- # Scrapy settings for renren project # # F ...
- Restful 风格
大家在做Web开发的过程中,method常用的值是get和post. 可事实上,method值还可以是put和delete等等其他值.既然method值如此丰富,那么就可以考虑使用同一个url,但是约 ...
- hive数据类型1
- js大文件上传
一般10M以下的文件上传通过设置Web.Config,再用VS自带的FileUpload控件就可以了,但是如果要上传100M甚至1G的文件就不能这样上传了.我这里分享一下我自己开发的一套大文件上传控件 ...
- mysql 松散索引与紧凑索引扫描(引入数据结构)
这一篇文章本来应该是放在 mysql 高性能日记中的,并且其优化程度并不高,但考虑到其特殊性和原理(索引结构也在这里稍微讲一下) 一,mysql 索引结构 (B.B+树) 要问到 mysql 的索引用 ...
- CTF中对web服务器各种提权姿势
在我们拿下服务器web服务往往只是低权限用户,对于内网渗透,我们往往需要root权限,Linux系统提权包括使用溢出漏洞已及利用系统配置文件. 提权前提: 1.拿到低权限shell 2.被入侵机器上有 ...
- 《JAVA语言》课问题汇总
一.阅读相应教材,或者使用互联网搜索引擎,弄清楚反码.补码跟原码这几个概念,然后编写示例程序,对正数.负数进行各种位操作,观察输出结果,与手工计算的结果进行比对,看看Java中的数是采用上述哪种码表示 ...