Atitit 图像金字塔原理与概率 attilax的理解总结qb23
Atitit 图像金字塔原理与概率 attilax的理解总结qb23
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):1
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓 2
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。2
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。 3
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的 3
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):
一般情况下有两种类型的图像金字塔常常出现在文献和以及实际运用中。他们分别是:
高斯金字塔 ( Gaussianpyramid): 用来向下采样,主要的图像金字塔
拉普拉斯金字塔 (Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用
1.2. 图像金字塔 高斯金字塔 采样金字塔
图像金字塔是通过将原始图像经过平滑、下采样所生成一系列具有不同分辨率的图像的集合。金字塔结构(Pyramid)适于多分辨率处理的一种图像存储数据结构。
最常用的生成图像金字塔的方法是采用高斯函数平滑图像,每次将分辨率降低为原来的一半,由此得到一个图像序列{ML,ML-1,……,M0},图像金字塔的存储量为N^2*(1+1/4+1/16+...)=(4*N^2)/3。
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。
值得注意的是,事物在真实世界中是客观存在的,但通过图像,在不同尺度下感知到的信息是不同的。
2
高斯图像金字塔
此处以SIFT算法中的高斯图像金字塔(Gaussian Pyramid)为例,解释图像金字塔的构成。尺度可变的高斯函数如下:
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。
有关图像金字塔在SIFT特征提取算法中的应用可参见Rachel Zhang的博文"SIFT特征提取分析"。
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的
,可以利用金字塔来检测不同尺度下的物体。但同时你也可以使用不同大小的sliding window在原图上做检测。
比如前面说的目标检测,有些情况下目标的变化尺度范围实际上是非常有限的,此时应该适当的设定尺度的数量,来减少不必要的计算量。比如你可以只降采样三次,你也可以降采样八次,去最上面的三个尺度。后者的好处是……快
比如OpenCV里SIFT的实现默认是上采样一次,降采样至无法再缩小为止。很多时候你其实不需要这么精细的特征点或这么high level的特征点,也许稍微改一下参数就可以优化一些速度回来。这里也需要提一下SURF的反向模拟尺度空间的思路,跟上面提到的高维LBP的思路如出一辙。
在点特征里面,有时候你希望你的点在整个尺度空间里都是很强的,不是那种在最开始还是一个比较强的特征点,尺度高了之后这个特征点就消失了。你希望你只处理那些从始至终都比较坚挺的特征点,那你就可以在金字塔的顶层提取特征点,然后只是在下面的层进行局部搜索验证……这样你可以一边提取着非常鲁棒的descriptor,一边还快如闪电……
视觉里面很多看似直观且简单的东西往往有层出不穷用法,除了这金字塔,还有比如直方图,比如二值化,比如卷积,比如积分图,比如距离变换……等等等等。虽然都不是什么高级的东西,一但用到巧处,也耐人寻味啊。
1.7. 图像金字塔最初用于机器视觉和图像压缩,
一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。当向金字塔的上层移动时,尺寸和分辨率就降低。
理论上讲,最好是2^n * 2 ^n 尺寸的图片,但实际上我们通过补0扩展、近似、内插等方法,可以处理任何尺寸的图片。
在一些边缘检测算法里面,为了忽略比较弱的边,也会利用尺度空间来进行降采样(对,高斯滤波大部分时候被理解成某种去噪/平滑操作,其实也是尺度空间思想)。
在一些基于特征的分类和识别问题里面,也有尺度空间的影子。比如基于高维LBP的人脸识别,其中LBP直方图的提取方式就蕴含有尺度空间的思想。
尺度空间的想法其实非常直观(当然证明它为什么那样构造可能会比较费事),但是因为尺度空间的构造和操作往往也是算法里面比较费时的地方,所以针对性的优化也应该说一下。
OpenCV图像处理篇之采样金字塔 - xiahouzuoxin - 博客频道 - CSDN.NET.html
图像处理之高斯金字塔 - 流浪的鱼 - 博客频道 - CSDN.NET.html
(3 条消息) 图像金字塔除了sift算法之外还有什么应用? - 知乎.html
Python图像处理(16):图像金字塔.html
12图像金字塔.htm
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 )
汉字名:艾提拉(艾龙), EMAIL:1466519819@qq.com
转载请注明来源: http://www.cnblogs.com/attilax/
Atiend
Atitit 图像金字塔原理与概率 attilax的理解总结qb23的更多相关文章
- Atitit 游戏的原理与概论attilax总结
Atitit 游戏的原理与概论attilax总结 1. 游戏历史2 1.1.1. 盘点PC游戏史上最重要的50款游戏2 1.1.2. 回味人类文明进程 五款经典的历史游戏2 2. 游戏类型(主要分为6 ...
- Atitit ocr识别原理 与概论 attilax总结
Atitit ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
- Atitit.ide技术原理与实践attilax总结
Atitit.ide技术原理与实践attilax总结 1.1. 语法着色1 1.2. 智能提示1 1.3. 类成员outline..func list1 1.4. 类型推导(type inferenc ...
- Atitit 《控制论原理与概论attilax总结
Atitit <控制论原理与概论attilax总结 <控制论> 奠基之作,出自创始人维纳.虽然内容权威,但我认为带有相当强烈的个人色彩,且门槛较高,不适合入门.深入研究控制论必看书籍 ...
- Atitit 自然语言处理原理与实现 attilax总结
Atitit 自然语言处理原理与实现 attilax总结 1.1. 中文分词原理与实现 111 1.2. 英文分析 1941 1.3. 第6章 信息提取 2711 1.4. 第7章 自动摘要 3041 ...
- Atitit 订单处理原理与功能设计attilax总结
Atitit 订单处理原理与功能设计attilax总结 订单有三大订单分类,商品订单,充值支付订单,报名订单等..1 订单完成流程 "select * from orderv2 where ...
- Atitit.并发编程原理与概论 attilax总结
Atitit.并发编程原理与概论 attilax总结 1. 并发一般涉及如下几个方面:2 2. 线程安全性 ( 2.2 原子性 2.3 加锁机制2 2.1. 线程封闭3.3.1Ad-hoc线程封闭 3 ...
- Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别
Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别 通常来说函数调用要用到的两条基本的指令:”CALL”指令和”RET”指令.”CALL”指令将当前的指令指针(这个指 ...
- OpenCV---图像金字塔原理
图像金字塔原理 (一)图像缩小(先高斯模糊,再降采样,需要一次次重复,不能一次到底) (二)图像扩大(先扩大,再卷积或者使用拉普拉斯金字塔) 图像金字塔介绍 图像金字塔是图像中多尺度表达的一种,最主要 ...
随机推荐
- mybatis多数据源配置
项目目录如下: 按照顺序配置吧 首先是配置config jdbc.driver=com.mysql.jdbc.Driver jdbc.url=jdbc:mysql://localhost:3306/a ...
- 如何防止JAVA反射对单例类的攻击?
在我的上篇随笔中,我们知道了创建单例类有以下几种方式: (1).饿汉式; (2).懒汉式(.加同步锁的懒汉式.加双重校验锁的懒汉式.防止指令重排优化的懒汉式); (3).登记式单例模式; (4).静态 ...
- Unsupported major.minor version 51.0解决方法
jdk1.6工程中使用外部jar包中类出现:Unsupported major.minor version 51.0 问题原因:外部jar包使用jdk1.7(jdk7)编译,而使用此jar包的工程jd ...
- ContentProvider要点复习
ContentProvider要点复习 ContentProvider作为四大组件之一,发挥着举足轻重的作用.与之相关联的另外两个类分别是ContentResolver和ContentObserver ...
- 老毛桃u盘装系统制作工具
老毛桃[url=http://www.laomaotao.cn.com/]一键u盘装系统下载[/url]告别繁琐,简单易用,一盘两用,携带方便.不需要任何技术基础,一键制作,自动完成制作,平时当U盘使 ...
- 【Android UI】Android Layout XML属性
Layout对于迅速的搭建界面和提高界面在不同分辨率的屏幕上的适应性具有很大的作用.这里简要介绍Android的Layout和研究一下它的实现. Android有Layout:FrameLayout, ...
- 「2014-4-13」Think twice before starting the adventure
杂文一篇. 1. 取名字真心是一件特别困难的事情.这位独立开发者花了将近两天的时间,给他的私人项目取了个名字:这篇博客<为何我不鸟你的开源项目>里显然还忽视了一个原因,就是名字取得太烂以至 ...
- Poj.Grids 2951 浮点数求高精度幂
2951:浮点数求高精度幂 总时间限制: 1000ms 内存限制: 65536kB 描述 有一个实数 R ( 0.0 < R < 99.999 ) ,要求写程序精确计算 R 的 n 次方. ...
- mysql监控和优化(2)
mysql主从复制 3个线程完成复制:主库1个线程负责记录数据库变更日志从库1个线程负责拉取主库的变更日志从库1个线程负责执行主库的变更日志实现了获取事件和重放事件的解耦,允许异步进行.复制的瓶颈:主 ...
- BZOJ2683 简单题(CDQ分治)
传送门 之前听别人说CDQ分治不难学,今天才知道果真如此.之前一直为自己想不到CDQ的方法二很不爽,今天终于是想出来了一道了,太弱-- cdq分治主要就是把整段区间分成两半,然后用左区间的值去更新右区 ...