sift特征

已经有很多博客已经将sift特征提取算法解释的很清楚了，我只是记录一些我不明白的地方，并且记录几个理解sift特征比较好的博客。

1. http://aishack.in/tutorials/sift-scale-invariant-feature-transform-introduction/

2. http://blog.csdn.net/abcjennifer/article/details/7639681/

3.http://blog.csdn.net/xiaowei_cqu/article/details/8067881

4.https://en.wikipedia.org/wiki/Scale_space

5.http://blog.csdn.net/pi9nc/article/details/23302075

一、说到sift特征就不得不提什么是尺度空间（scale-space）

一个感观的认识就是人眼在看一个物体的时候远和近时，物体在视网膜上成像。尺度空间中各尺度图像的模糊程度逐渐变大，能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。在图像形成的过程中不可避免的会有将摄像头拉近或者拉远的操作，而这种操作带来的就是尺度的变化，这也是想寻找尺度不变特征的原因。

一个理论上的解释参考WIKI：The main type of scale space is the linear (Gaussian) scale space：

就是说尺度空间就是用不同参数t的高斯核去卷积图像得到的。我们可以从参考材料的1和4中可以看到模糊的例子，上面的t是方差，也就是下文将要说的sigma的平方。

二、尺度不变性

参考这个网址：http://dsp.stackexchange.com/questions/397/why-is-the-difference-of-gaussians-scale-space-scale-invariant?rq=1，对尺度不变性给出了一个简单的回答：

The term "scale-invariant" means the following here. Let's say you have image I, and you have detected a feature (aka an interest point) f at some location (x,y) and at some scale level s. Now let's say you have an image I', which is a scaled version of I (downsampled, for instance). Then, if your feature detector is scale-invariant, you should be able to detect the corresponding feature f' in I' at the corresponding location (x',y') and corresponding scale s', where (x, y, s) and (x', y', s')are related by the appropriate scaling transformation.

我的理解就是说如果你的图片I在尺度s下被检测出在（x,y）下具有特征点f，那么如果你有另一张在其他尺度s'下的图片I'，如果你的特征检测器是尺度不变的话，你应该可以检测出对应的特征点f'，位置于（x',y'）使得（x,y,s）与（x',y',s'）只差一个放缩变换。下面有一个我自己的理解，不一定正确，有时间我在看看尺度理论。假设在sigma尺度下找到的特征点为（x,y,sigma）则有下面这个等式成立，这里的sigma是方差：

如果另一张图片在另外一个尺度下，也就是将图片I进行模糊后，在求极值寻找特征点会有以下的式子(误，只是一种数学上的感觉)：

（这里的t和一中的t不是同一个）我们用G（x,y,t）对图片I进行模糊得到另外一个尺度的图片，然后我们再用DOG对其进行卷积并在尺度sigma下求极值。根据卷积的结合律（可以参考WIKI：https://en.wikipedia.org/wiki/Convolution）就有上式第二行的结果，然后根据卷积的交换律有第三行的结果，然后t和sigma是独立的或者说t是常量所以从求导符号中提出来，然后根据上上式就会发现上上式求得的极值点也是另一个尺度图片下求得的极值点。用一篇论文的一个图片例子：

上图就发现在相对应的特征点是不同scale上的极值点。

三、为什么要用GOG（difference of Gaussian）去替换LOG（Laplancian of Gaussian）

根据这篇文章：http://www.scholarpedia.org/article/Scale_Invariant_Feature_Transform

也就是说Lindeberg在他的两篇关于blob detection论文中发现blob可以通过scale-normalized Laplacian检测出来，那么什么是尺度归一化的拉普拉斯呢？文章又给出了定义，就是上图的第一个公式（s是方差，也就是sigma的平方）。然后在sift中为什么不用尺度归一化的拉普拉斯变换来计算尺度不变的特征点呢？原因是他又发现DOG是LOG的一个近似，而且据说计算速度更快。是怎么证明DOG是LOG的近似呢？这里我来证明一下。这里有几个定义混淆了，我们先区分一下：

1. 拉普拉斯变换，对函数f（x,y）进行拉普拉斯变换就是求二阶偏导数相加：

2. Laplacian of Gaussian (LOG)

3. 尺度不变的拉普拉斯变换，根据上面文章第一个公式，由于卷积与导数的运算法则，可以知道尺度不变的拉普拉斯变换是:

4. Difference of Gaussian (DOG)

5. 二维的高斯分布，均值为0，方差为sigma平方

6. 证明DOG是LOG的一个近似，首先我们证明下面这个式子成立：

非常简单，只要你知道如何求高斯函数的导数就好了，等式右边的求导过程可以参考网址：http://fourier.eng.hmc.edu/e161/lectures/gradient/node8.html，在这里我给一个简单的证明。

因此等式右边等于：

等式左边对sigma进行求导，求导过程非常简单，我就不打算记录很详细了：

因此我们左边等于右边，只需稍微化简一下。因此有下面这个成立：

因此DOG和尺度归一化的LOG只差一个常数因子（k-1）并不影响极值点位置的求取，见博客（blog.csdn.net/pi9nc/article/details/23302075）。整个近似就证明完毕（*）。

　　上面只是说了一些我对尺度空间明白的地方，当然还有很多不明白的地方等我以后看懂了再回头记下，又回到sift特征，还有几个主题想记录一下。

四、我们在每座高斯金字塔中额外的新增了3层，为什么能够满足尺度变化的连续性。我觉得参考文章2中已经解释的很清楚，我直接转和复制一下，并且附上我自己手绘的一幅图便于理解：

暂时明白了这么多，以后再加，剩下的理解在源码中注释了，见另外的一篇博客

sift特征的更多相关文章

SIFT特征详解
1.SIFT概述 SIFT的全称是Scale Invariant Feature Transform,尺度不变特征变换,由加拿大教授David G.Lowe提出的.SIFT特征对旋转.尺度缩放.亮度变 ...
opencv获取图片sift特征
利用opencv2.3来获取图片的sift特征,并输出到标准输出,可用重定向到文件. #include<cstdio> #include"opencv2/opencv.hpp&q ...
opencv java api提取图片sift特征
opencv在2.4.4版本以后添加了对java的最新支持,可以利用java api了.下面就是我利用opencv的java api 提取图片的sift特征. import org.opencv.co ...
[Computer Vision] SIFT特征学习笔记
SIFT(Scale Invariant Feature Transform),尺度空间不变特征,目前手工设计的最好vision特征. 以下是学习http://blog.csdn.net/zddblo ...
SIFT特征点检测学习一（转载）
新手上路,先转载学习tornadomeet的博客:http://www.cnblogs.com/tornadomeet/archive/2012/08/16/2643168.html 特征点检测学习_ ...
基于SIFT特征的全景图像拼接
基于SIFT特征的全景图像拼接分类: image Machine learning2013-07-05 13:33 2554人阅读评论(3) 收藏举报基于SIFT特征的全景图像拼接分类: 计 ...
机器学习进阶-案例实战-图像全景拼接-书籍SIFT特征点连接 1.cv2.drawMatches(对两个图像的关键点进行连线操作)
1.cv2.drawMatches(imageA, kpsA, imageB, kpsB, matches[:10], None, flags=2) # 对两个图像关键点进行连线操作参数说明:im ...
OpenCV教程(47) sift特征和surf特征
在前面三篇教程中的几种角检测方法,比如harris角检测,都是旋转无关的,即使我们转动图像,依然能检测出角的位置,但是图像缩放后,harris角检测可能会失效,比如下面的图像,图像放大之前可 ...
使用sift特征点进行knn最近邻匹配
#include <opencv2/xfeatures2d/nonfree.hpp> #include <opencv2/features2d/features2d.hpp> ...

随机推荐

ActionBar设置自定义setCustomView()留有空白的问题
先来看问题,当我使用ActionBar的时候,设置setCustomView时,会留有空白的处理网上很多朋友说可以修改V7包到19,结果处理的效果也是不理想的. 下面贴出我觉得靠谱的处理代码 pub ...
Mybatis环境
第一步:下载jar包并导入 1.mysql驱动包 2.mybatis环境包第二步:创建MYSQL数据库由于这是用于测试,只创建了test-usreinfo数据表第三步:在src文件夹中创建myb ...
Android如何自定义dialog
; window.setAttributes(lp); // set the confirm button if (positiveButtonClickListener != null) { ((B ...
Java之this关键字的用法
Java 中的 this 关键字指当前的对象,可以直接用其调用当前对象的成员变量,也可以直接用其调用当前对象的成员方法,这是我们常见的场景,那么有没有其它的情况呢! this 还可以在无参的构造方法中 ...
Solr实战:使用Hue+Solr实现标签查询
公司最近在研究多条件组合查询方案,Google的一位技术专家Sam和我们讨论了几个备选方案. Sam的信: 我做了进一步研究,目前有这么几种做法: 1) 最直接粗暴,只做一个主index,比如按行业+ ...
如何打开、关闭IIS服务器
问题描述:如题. 使用工具:腾讯云Windows Server 2012 R2 数据中心版 64位中文版. 操作步骤: 1.服务器管理器->IIS
Linux查看物理CPU个数、核数、逻辑CPU个数
# 总核数 = 物理CPU个数 X 每颗物理CPU的核数 # 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数 # 查看物理CPU个数 cat /proc/cpuinfo| ...
pmd静态代码分析
在正式进入测试之前,进行一定的静态代码分析及code review对代码质量及系统提高是有帮助的,以上为数据证明 Pmd 它是一个基于静态规则集的Java源码分析器,它可以识别出潜在的如下问题:– 可 ...
HTML 学习笔记 JavaScript（面向对象）
现在让我们继续跟着大神的脚步前进学习一下JavaScript中的面向对象的思想,其实作为一个iOS开发者,对面向对象还是比较熟悉的,但是昨晚看了一下Js中的面向对象,妈蛋一脸萌比啊.还好有大神.让 ...
oracle函数
oracle中函数分为3大类,分别为:单行函数,分组函数,分析函数. 1.单行函数单行函数同时只能对一行进行操作,且对输入的每一行返回一行输出结果. 单行函数还分为:字符函数,数子函数,日期函数,转 ...

sift特征

sift特征的更多相关文章

随机推荐

热门专题