Atitit 图像金字塔原理与概率 attilax的理解总结qb23
Atitit 图像金字塔原理与概率 attilax的理解总结qb23
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):1
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓 2
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。2
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。 3
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的 3
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):
一般情况下有两种类型的图像金字塔常常出现在文献和以及实际运用中。他们分别是:
高斯金字塔 ( Gaussianpyramid): 用来向下采样,主要的图像金字塔
拉普拉斯金字塔 (Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用
1.2. 图像金字塔 高斯金字塔 采样金字塔
图像金字塔是通过将原始图像经过平滑、下采样所生成一系列具有不同分辨率的图像的集合。金字塔结构(Pyramid)适于多分辨率处理的一种图像存储数据结构。
最常用的生成图像金字塔的方法是采用高斯函数平滑图像,每次将分辨率降低为原来的一半,由此得到一个图像序列{ML,ML-1,……,M0},图像金字塔的存储量为N^2*(1+1/4+1/16+...)=(4*N^2)/3。
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。
值得注意的是,事物在真实世界中是客观存在的,但通过图像,在不同尺度下感知到的信息是不同的。
2
高斯图像金字塔
此处以SIFT算法中的高斯图像金字塔(Gaussian Pyramid)为例,解释图像金字塔的构成。尺度可变的高斯函数如下:
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。
有关图像金字塔在SIFT特征提取算法中的应用可参见Rachel Zhang的博文"SIFT特征提取分析"。
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的
,可以利用金字塔来检测不同尺度下的物体。但同时你也可以使用不同大小的sliding window在原图上做检测。
比如前面说的目标检测,有些情况下目标的变化尺度范围实际上是非常有限的,此时应该适当的设定尺度的数量,来减少不必要的计算量。比如你可以只降采样三次,你也可以降采样八次,去最上面的三个尺度。后者的好处是……快
比如OpenCV里SIFT的实现默认是上采样一次,降采样至无法再缩小为止。很多时候你其实不需要这么精细的特征点或这么high level的特征点,也许稍微改一下参数就可以优化一些速度回来。这里也需要提一下SURF的反向模拟尺度空间的思路,跟上面提到的高维LBP的思路如出一辙。
在点特征里面,有时候你希望你的点在整个尺度空间里都是很强的,不是那种在最开始还是一个比较强的特征点,尺度高了之后这个特征点就消失了。你希望你只处理那些从始至终都比较坚挺的特征点,那你就可以在金字塔的顶层提取特征点,然后只是在下面的层进行局部搜索验证……这样你可以一边提取着非常鲁棒的descriptor,一边还快如闪电……
视觉里面很多看似直观且简单的东西往往有层出不穷用法,除了这金字塔,还有比如直方图,比如二值化,比如卷积,比如积分图,比如距离变换……等等等等。虽然都不是什么高级的东西,一但用到巧处,也耐人寻味啊。
1.7. 图像金字塔最初用于机器视觉和图像压缩,
一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。当向金字塔的上层移动时,尺寸和分辨率就降低。
理论上讲,最好是2^n * 2 ^n 尺寸的图片,但实际上我们通过补0扩展、近似、内插等方法,可以处理任何尺寸的图片。
在一些边缘检测算法里面,为了忽略比较弱的边,也会利用尺度空间来进行降采样(对,高斯滤波大部分时候被理解成某种去噪/平滑操作,其实也是尺度空间思想)。
在一些基于特征的分类和识别问题里面,也有尺度空间的影子。比如基于高维LBP的人脸识别,其中LBP直方图的提取方式就蕴含有尺度空间的思想。
尺度空间的想法其实非常直观(当然证明它为什么那样构造可能会比较费事),但是因为尺度空间的构造和操作往往也是算法里面比较费时的地方,所以针对性的优化也应该说一下。
OpenCV图像处理篇之采样金字塔 - xiahouzuoxin - 博客频道 - CSDN.NET.html
图像处理之高斯金字塔 - 流浪的鱼 - 博客频道 - CSDN.NET.html
(3 条消息) 图像金字塔除了sift算法之外还有什么应用? - 知乎.html
Python图像处理(16):图像金字塔.html
12图像金字塔.htm
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 )
汉字名:艾提拉(艾龙), EMAIL:1466519819@qq.com
转载请注明来源: http://www.cnblogs.com/attilax/
Atiend
Atitit 图像金字塔原理与概率 attilax的理解总结qb23的更多相关文章
- Atitit 游戏的原理与概论attilax总结
Atitit 游戏的原理与概论attilax总结 1. 游戏历史2 1.1.1. 盘点PC游戏史上最重要的50款游戏2 1.1.2. 回味人类文明进程 五款经典的历史游戏2 2. 游戏类型(主要分为6 ...
- Atitit ocr识别原理 与概论 attilax总结
Atitit ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
- Atitit.ide技术原理与实践attilax总结
Atitit.ide技术原理与实践attilax总结 1.1. 语法着色1 1.2. 智能提示1 1.3. 类成员outline..func list1 1.4. 类型推导(type inferenc ...
- Atitit 《控制论原理与概论attilax总结
Atitit <控制论原理与概论attilax总结 <控制论> 奠基之作,出自创始人维纳.虽然内容权威,但我认为带有相当强烈的个人色彩,且门槛较高,不适合入门.深入研究控制论必看书籍 ...
- Atitit 自然语言处理原理与实现 attilax总结
Atitit 自然语言处理原理与实现 attilax总结 1.1. 中文分词原理与实现 111 1.2. 英文分析 1941 1.3. 第6章 信息提取 2711 1.4. 第7章 自动摘要 3041 ...
- Atitit 订单处理原理与功能设计attilax总结
Atitit 订单处理原理与功能设计attilax总结 订单有三大订单分类,商品订单,充值支付订单,报名订单等..1 订单完成流程 "select * from orderv2 where ...
- Atitit.并发编程原理与概论 attilax总结
Atitit.并发编程原理与概论 attilax总结 1. 并发一般涉及如下几个方面:2 2. 线程安全性 ( 2.2 原子性 2.3 加锁机制2 2.1. 线程封闭3.3.1Ad-hoc线程封闭 3 ...
- Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别
Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别 通常来说函数调用要用到的两条基本的指令:”CALL”指令和”RET”指令.”CALL”指令将当前的指令指针(这个指 ...
- OpenCV---图像金字塔原理
图像金字塔原理 (一)图像缩小(先高斯模糊,再降采样,需要一次次重复,不能一次到底) (二)图像扩大(先扩大,再卷积或者使用拉普拉斯金字塔) 图像金字塔介绍 图像金字塔是图像中多尺度表达的一种,最主要 ...
随机推荐
- js性能优化
使用局部变量(尽量缩短作用域链)JavaScript引擎对变量的解析时间跟作用域链的深度有关.局部变量由于处于链尾,存取速度是最快的,因此,一个好的经验是:任何非局部变量使用超过一次时,请使用局部变量 ...
- JS-数组的方法
var arr = [ 1,2,3 ];arr.push( 'abc' );//从后面加 arr.unshift( 0 );//从前面加 arr.pop()//从后面删除 arr.shift()//从 ...
- 批量创建SQL Server分区文件
) declare @i int set @table = 'v3_yqsd_report' begin exec('alter database '+@table+' add filegroup O ...
- ANSI C 所有的转义字符
\a 响铃符 \b 回退符 \f 换页符 \n 换行符 \r 回车符 \t 横向制表符 \v 纵向制表符 \\ 反斜杠 \? 问号 \' 单引号 \" 双引号 \000 八进制数 \xhh ...
- NIO概述
NIO API从Java1.4开始引用起就被广泛应用所使用.NIO API自带了IO非阻塞操作. java.nio.*包的结构: · Buffers 作为数据容器 · Chartsets 将容器中的数 ...
- tomee 消息持久化
http://tomee.apache.org/jms-resources-and-mdb-container.html http://activemq.apache.org/xml-configur ...
- 用js实现瀑布流的一种简单方法
现在说瀑布流式布局似乎有点晚了,但是每一项技术都是向着“精”和“简”的方向在不断发展,在发展到极致之前,需要一个相当漫长的过程,因此,从这个角度来说,当瀑布流被应用得越来越多的时候,反而更应该讨论它, ...
- Sqlite 管理工具收藏
1.SQLite Administrator http://download.orbmu2k.de/files/sqliteadmin.zip 2.SQLite2009Pro-v3.8.3.1 h ...
- 运维自动化工具---Puppet
案例环境:-----------------------------------------------------------------主机 操作系统 IP地址 主要软件--------- ...
- STM32的DMA
什么是DMA?其全称是:Direct Memory Access:根据ST公司提供的相关信息,DMA是STM32中一个独立与Cortex-M3内核的模块,有点类似与ADC.PWM.TIMER等模块:主 ...