SIFT(Scale Invariant Feature Transform)，尺度空间不变特征，目前手工设计的最好vision特征。

以下是学习http://blog.csdn.net/zddblog/article/details/7521424后的收获。

一、尺度空间

gaussian pyramid的产生：

1、为避免对第一组第一层图片（原始图片）做高斯滤波导致损失，在其基础上将尺度扩大一倍作为-1层，方法是用=0.5做高斯滤波。

2、对每组（octave）倒数第三张图片做降采样，产生下组的第一层图片（第一组不用），由于降采样，越往上图片越小。

3、每层图片在上一层基础上做高斯滤波。

所谓尺度即一张图片的精细程度或概括度，用度量，

由下往上尺度变大。尺度用高斯函数中的方差来描述。

从2.1的高斯分布图可知，对一个区域做高斯滤波，若方差越大（峰越低），则这个点被平滑得越厉害，那么图像就变得越模糊。在模糊的图片中我们看到的是更宏观的东西（大，尺度大），而清晰的图片看到的是更为微观的东西（小，尺度小）。

点->线，边缘，角点->轮廓形状->鼻子，嘴巴->头->人（尺度由小到大）

组（O，octave），层（S），尺度（）三者的关系：

可见逐组逐层递增。

二、尺度空间上的关键点选取

关键点，即金字塔上的三维局部极值点。（三维：x，y，，每张图上的位置及图的尺度）

1、首先对gaussian做高斯差分（Difference of Gaussian，DOG）

即上层减下层。

原因：2002年Mikolajczyk在详细的实验比较中发现尺度归一化的高斯拉普拉斯函数的极大值和极小值同其它的特征提取函数，例如：梯度，Hessian或Harris角特征比较，能够产生最稳定的图像特征。而Lindeberg早在1994年就发现高斯差分函数（Difference of Gaussian ，简称DOG算子）与尺度归一化的高斯拉普拉斯函数非常近似。

所以用DOG之后提取的极值更有效。从而金字塔变成：

2、关键点定位

取三维极值点。

用到了两个trick

（1）子像素插值（Sub-pixel Interpolation），找到连续空间上的精确极值点。

（2）消除边缘效应，DOG算子会产生较强的边缘响应。

3、关键点方向

在每个找到的关键点的二维邻域内取方向梯度直方图，数值最大的方向作为该关键点的方向。

三、关键点的特征描述

每个关键点用一个向量来描述。

描述的方法就是取这个关键点在二维领域空间内的梯度值，

（1）取该点周围的4×4个区域，每个区域内含多个像素点

（2）每个区域的坐标轴旋转到该关键点的主方向上

（3）将子区域内的像素点的梯度值分配到8个方向上，计算其权值。

这样对于一个关键点，有4× 4× 8 = 128特征值。

SIFT的产生就是这样，对于一张输入图片，假设对其找到了K个关键点，他就有K× 128维的SIFT特征。

[Computer Vision] SIFT特征学习笔记的更多相关文章

LBP特征学习笔记
这几天一直在做人脸识别的项目,有用到LBP特征,但是毫无头绪,师姐这几天也比较忙,没有时间来指导我,随自己找相应的介绍LBP的博文来看,现在总算有了一个大体的思路了,就写下来吧注:参考博文: 目标检 ...
Learning ROS for Robotics Programming Second Edition学习笔记(五) indigo computer vision
中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...
【学习笔记】SIFT尺度不变特征（配合UCF-CRCV课程视频）
SIFT尺度不变特征 D. Lowe. Distinctive image features from scale-invariant key points, IJCV 2004 -Lecture 0 ...
[学习笔记] CS131 Computer Vision: Foundations and Applications：Lecture 1 课程介绍
课程大纲:http://vision.stanford.edu/teaching/cs131_fall1718/syllabus.html 课程定位: 课程交叉: what is (computer) ...
[学习笔记] CS131 Computer Vision: Foundations and Applications：Lecture 2 颜色和数学基础
大纲 what is color? The result of interaction between physical light in the environment and our visual ...
[学习笔记] CS131 Computer Vision: Foundations and Applications：Lecture 4 像素和滤波器
Background reading: Forsyth and Ponce, Computer Vision Chapter 7 Image sampling and quantization Typ ...
Sparse Filtering 学习笔记（二）好特征的刻画
Sparse Filtering 是一个用于提取特征的无监督学习算法,与通常特征学习算法试图建模训练数据的分布的做法不同,Sparse Filtering 直接对训练数据的特征分布进行分析,在所谓 ...
SIFT特征点检测学习一（转载）
新手上路,先转载学习tornadomeet的博客:http://www.cnblogs.com/tornadomeet/archive/2012/08/16/2643168.html 特征点检测学习_ ...
ArcGIS案例学习笔记-聚类点的空间统计特征
ArcGIS案例学习笔记-聚类点的空间统计特征联系方式:谢老师,135-4855-4328,xiexiaokui@qq.com 目的:对于聚集点,根据分组字段case field,计算空间统计特征 ...

随机推荐

如何把jquery 的dialog和ztree结合
第一步:先准备好juqury-ui.ztree 的js文件和css 文件第二步:example.jsp文件代码中写 ..引入jqueryui.ztree 的js和css文件 <body> ...
codeforces 721C (拓扑+dp)
题意就是某个人去游览,起点是1点,终点是n点,他总的游览时间不能超过t,第一行给你3个数字,点的个数n,边的个数m,时间t,然后底下m行数据,每行代表一条边,边的起点,终点和权值(走过去花的时间),然 ...
使用webview如何做超时判断
在加载网页时给一个timer定时器,规定超时时间,然后再超时时间的方法中提示超时如果没有超时,则在webview协议中的“加载完成”方法中取消timer定时器 - (void)openWebVie ...
Oracle VM Virtual 下CentOS不能自动获取IP地址
在CentOS配置网卡开机自动获取IP地址: vi /etc/sysconfig/network-scripts/ifcfg-eth0 将 ONBOOT="no" 改为 ONBOO ...
[React] React Fundamentals: Owner Ownee Relationship
The owner-ownee relationship is used to designate a parent-child relationship with React components ...
TIMESTAMP 与 explicit_defaults_for_timestamp
在MySQL 5.6.6之前,TIMESTAMP的默认行为: TIMESTAMP列如果没有明确声明NULL属性,默认为NOT NULL.(而其他数据类型,如果没有显示声明为NOT NULL,则允许NU ...
Asp.Net MVC 实用视频教程
[北盟学习BaMn.Cn] Asp.Net MVC 第01课--创建第一个项目.avi [北盟学习BaMn.Cn] Asp.Net MVC 第02课--自己建一个controller view.avi ...
Linux common resources
Useful Linux Web reources list Linux die manual Linux Man Pages Archive Linux RPM find Linux RPM Sea ...
HttpClient4.4 进行Http连接通讯
以前一直使用jdk自带的urlConnection来进行http通讯,HttpClient与之相比,HttpClient更具有灵活度和易用性.HttpClient能够方便使用连接池,使用时需要重新创建 ...
Nginx高性能服务器安装、配置、运维（3） —— Nginx配置详解
四.Nginx 配置详解 YUM方式安装的Nginx默认配置文件放在/etc/nginx目录下,使用Vim编辑/etc/nginx/nginx.conf: ---------------------- ...

[Computer Vision] SIFT特征学习笔记