Atitit 图像金字塔原理与概率 attilax的理解总结qb23
Atitit 图像金字塔原理与概率 attilax的理解总结qb23
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):1
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓 2
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。2
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。 3
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的 3
1.1. 高斯金字塔 ( Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):
一般情况下有两种类型的图像金字塔常常出现在文献和以及实际运用中。他们分别是:
高斯金字塔 ( Gaussianpyramid): 用来向下采样,主要的图像金字塔
拉普拉斯金字塔 (Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用
1.2. 图像金字塔 高斯金字塔 采样金字塔
图像金字塔是通过将原始图像经过平滑、下采样所生成一系列具有不同分辨率的图像的集合。金字塔结构(Pyramid)适于多分辨率处理的一种图像存储数据结构。
最常用的生成图像金字塔的方法是采用高斯函数平滑图像,每次将分辨率降低为原来的一半,由此得到一个图像序列{ML,ML-1,……,M0},图像金字塔的存储量为N^2*(1+1/4+1/16+...)=(4*N^2)/3。
1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的解释就是,在低尺度下可以看清楚很多细节,在高尺度下可以看到轮廓
1.4. 在一幅图像中,要想描述真实世界的结构与信息,多尺度描述至关重要。
值得注意的是,事物在真实世界中是客观存在的,但通过图像,在不同尺度下感知到的信息是不同的。
2
高斯图像金字塔
此处以SIFT算法中的高斯图像金字塔(Gaussian Pyramid)为例,解释图像金字塔的构成。尺度可变的高斯函数如下:
1.5. 图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。
有关图像金字塔在SIFT特征提取算法中的应用可参见Rachel Zhang的博文"SIFT特征提取分析"。
1.6. 在目标检测领域,图像中的物体通常很可能是远近不一,大小不一的
,可以利用金字塔来检测不同尺度下的物体。但同时你也可以使用不同大小的sliding window在原图上做检测。
比如前面说的目标检测,有些情况下目标的变化尺度范围实际上是非常有限的,此时应该适当的设定尺度的数量,来减少不必要的计算量。比如你可以只降采样三次,你也可以降采样八次,去最上面的三个尺度。后者的好处是……快
比如OpenCV里SIFT的实现默认是上采样一次,降采样至无法再缩小为止。很多时候你其实不需要这么精细的特征点或这么high level的特征点,也许稍微改一下参数就可以优化一些速度回来。这里也需要提一下SURF的反向模拟尺度空间的思路,跟上面提到的高维LBP的思路如出一辙。
在点特征里面,有时候你希望你的点在整个尺度空间里都是很强的,不是那种在最开始还是一个比较强的特征点,尺度高了之后这个特征点就消失了。你希望你只处理那些从始至终都比较坚挺的特征点,那你就可以在金字塔的顶层提取特征点,然后只是在下面的层进行局部搜索验证……这样你可以一边提取着非常鲁棒的descriptor,一边还快如闪电……
视觉里面很多看似直观且简单的东西往往有层出不穷用法,除了这金字塔,还有比如直方图,比如二值化,比如卷积,比如积分图,比如距离变换……等等等等。虽然都不是什么高级的东西,一但用到巧处,也耐人寻味啊。
1.7. 图像金字塔最初用于机器视觉和图像压缩,
一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。当向金字塔的上层移动时,尺寸和分辨率就降低。
理论上讲,最好是2^n * 2 ^n 尺寸的图片,但实际上我们通过补0扩展、近似、内插等方法,可以处理任何尺寸的图片。
在一些边缘检测算法里面,为了忽略比较弱的边,也会利用尺度空间来进行降采样(对,高斯滤波大部分时候被理解成某种去噪/平滑操作,其实也是尺度空间思想)。
在一些基于特征的分类和识别问题里面,也有尺度空间的影子。比如基于高维LBP的人脸识别,其中LBP直方图的提取方式就蕴含有尺度空间的思想。
尺度空间的想法其实非常直观(当然证明它为什么那样构造可能会比较费事),但是因为尺度空间的构造和操作往往也是算法里面比较费时的地方,所以针对性的优化也应该说一下。
OpenCV图像处理篇之采样金字塔 - xiahouzuoxin - 博客频道 - CSDN.NET.html
图像处理之高斯金字塔 - 流浪的鱼 - 博客频道 - CSDN.NET.html
(3 条消息) 图像金字塔除了sift算法之外还有什么应用? - 知乎.html
Python图像处理(16):图像金字塔.html
12图像金字塔.htm
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 )
汉字名:艾提拉(艾龙), EMAIL:1466519819@qq.com
转载请注明来源: http://www.cnblogs.com/attilax/
Atiend
Atitit 图像金字塔原理与概率 attilax的理解总结qb23的更多相关文章
- Atitit 游戏的原理与概论attilax总结
Atitit 游戏的原理与概论attilax总结 1. 游戏历史2 1.1.1. 盘点PC游戏史上最重要的50款游戏2 1.1.2. 回味人类文明进程 五款经典的历史游戏2 2. 游戏类型(主要分为6 ...
- Atitit ocr识别原理 与概论 attilax总结
Atitit ocr识别原理 与概论 attilax总结 1.1. Ocr的过程与流程1 1.2. OCR不同技术细分略有不同,但大概原理是一样的. 即主要技术过程是:二值化(又叫归一化)----- ...
- Atitit.ide技术原理与实践attilax总结
Atitit.ide技术原理与实践attilax总结 1.1. 语法着色1 1.2. 智能提示1 1.3. 类成员outline..func list1 1.4. 类型推导(type inferenc ...
- Atitit 《控制论原理与概论attilax总结
Atitit <控制论原理与概论attilax总结 <控制论> 奠基之作,出自创始人维纳.虽然内容权威,但我认为带有相当强烈的个人色彩,且门槛较高,不适合入门.深入研究控制论必看书籍 ...
- Atitit 自然语言处理原理与实现 attilax总结
Atitit 自然语言处理原理与实现 attilax总结 1.1. 中文分词原理与实现 111 1.2. 英文分析 1941 1.3. 第6章 信息提取 2711 1.4. 第7章 自动摘要 3041 ...
- Atitit 订单处理原理与功能设计attilax总结
Atitit 订单处理原理与功能设计attilax总结 订单有三大订单分类,商品订单,充值支付订单,报名订单等..1 订单完成流程 "select * from orderv2 where ...
- Atitit.并发编程原理与概论 attilax总结
Atitit.并发编程原理与概论 attilax总结 1. 并发一般涉及如下几个方面:2 2. 线程安全性 ( 2.2 原子性 2.3 加锁机制2 2.1. 线程封闭3.3.1Ad-hoc线程封闭 3 ...
- Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别
Atitit 函数调用的原理与本质attilax总结 stdcall cdecl区别 通常来说函数调用要用到的两条基本的指令:”CALL”指令和”RET”指令.”CALL”指令将当前的指令指针(这个指 ...
- OpenCV---图像金字塔原理
图像金字塔原理 (一)图像缩小(先高斯模糊,再降采样,需要一次次重复,不能一次到底) (二)图像扩大(先扩大,再卷积或者使用拉普拉斯金字塔) 图像金字塔介绍 图像金字塔是图像中多尺度表达的一种,最主要 ...
随机推荐
- MFC修改初始窗口大小和窗口名字禁止窗口最大,最小化
2,在里面就可以修改初始窗口大小和窗口名字 BOOL CMainFrame::PreCreateWindow(CREATESTRUCT& cs){if( !CFrameWnd::PreCrea ...
- HTML5 Web Worker的使用
Web Workers 是 HTML5 提供的一个javascript多线程解决方案,我们可以将一些大计算量的代码交由web Worker运行而不冻结用户界面. 一:如何使用Worker Web Wo ...
- shell编写mysql备份工具
如需转载,请经本人同意. 这是之前写的一个备份脚本,调用的备份工具是xtrabackup 编写思路是:每周一全备份,备份后提取lSN号,对备份文件进行压缩,其余时候在LSN的基础上进行增量备份,并对3 ...
- some tips learn from work experience
1.you can't avoid office politics 2.you'll never have a job which you "can't quit" - if yo ...
- 什么是SQL注入
一种简单的web应用架构,: 表示层(web浏览器或呈现引擎)———>逻辑层(如C#,ASP,.NET,PHP,JSP等编程语言)———>存储层(如Microsoft SQL Server ...
- 图层的核心动画(CABaseAnimation)续
Main.storyboard ViewController.m // // ViewController.m // 8A01.核心动画 // // Created by huan on 16/ ...
- Postman-进阶
Postman-简单使用 Postman-进阶使用 Postman-CI集成Jenkins 管理请求 保存请求-添加“打开百度首页请求” 设置请求方式为Get,地址为www.baidu.com.点击右 ...
- webapi版本升级管理
由于近期公司人员流动,本人临时客串webapi开发,针对开发过程中碰到一些问题做一些改进 1.当前做法 项目webapi项目是居于asp.net框架开发的,每个功能模块新建一个api控制器,比如Use ...
- form表单回车提交
当form中只有一个input[type="text"](其他的表单元素可以随意有)的输入框时候,当input[type="text"]获得焦点的时候,无论表单 ...
- 基于VC的ACM音频编程接口压缩Wave音频(三)
(三)音 频 数 据 的 压 缩 下 面 说 明 使 用 CODEC 实 现 音 频 压 缩 的 过 程:假 设 源 信 号 为8K 采 样.16bits PCM 编 码. 单 声 道. 长 度 为1 ...