特征提取函数:

  1. int _sift_features( IplImage* img, struct feature** feat, int intvls,
  2. double sigma, double contr_thr, int curv_thr,
  3. int img_dbl, int descr_width, int descr_hist_bins )
  4. {
  5. IplImage* init_img;
  6. IplImage*** gauss_pyr, *** dog_pyr;
  7. CvMemStorage* storage;
  8. CvSeq* features;
  9. int octvs, i, n = 0;
  10.  
  11. /* check arguments */
  12. if( ! img )
  13. fatal_error( "NULL pointer error, %s, line %d", __FILE__, __LINE__ );
  14.  
  15. if( ! feat )
  16. fatal_error( "NULL pointer error, %s, line %d", __FILE__, __LINE__ );
  17.  
  18. /* build scale space pyramid; smallest dimension of top level is ~4 pixels */
  19. init_img = create_init_img( img, img_dbl, sigma );//创建初始图像,灰度,每位32F(单精度浮点)来存储。
  20. octvs = log( MIN( init_img->width, init_img->height ) ) / log(2) - 2; //从原始图像构建金字塔的层数,-2 使得最小的一层图像有4个像素,而不是1个像素
  21. gauss_pyr = build_gauss_pyr( init_img, octvs, intvls, sigma );//创建高斯金字塔,octvs层数(0层是原图,向上每层降采样一次),intvls每层中尺寸相同但是模糊程度不同,sigma模糊的初始参数,intvals+3
  22. dog_pyr = build_dog_pyr( gauss_pyr, octvs, intvls );//差分金字塔,层数不变,每层中用相邻图像相减,故每层图像数intvls+2
  23.  
  24. storage = cvCreateMemStorage( 0 );
  25. features = scale_space_extrema( dog_pyr, octvs, intvls, contr_thr,
  26. curv_thr, storage );//检测极值点,在同一层中的图片,的一个像素点,如果是相邻另个模糊度图像对应3x3window中的max值(像素>0时),或者为min值(像素<0时),并且经过插值获得亚像素极值点的坐标,测试对比度,边缘影响,最后将该像素对应在原图中的坐标记录到feat中,将所有满足条件的像素的feat串联到featuresSeq中。
  27. calc_feature_scales( features, sigma, intvls );
  28. if( img_dbl )
  29. adjust_for_img_dbl( features );
  30. calc_feature_oris( features, gauss_pyr );
  31. compute_descriptors( features, gauss_pyr, descr_width, descr_hist_bins );
  32.  
  33. /* sort features by decreasing scale and move from CvSeq to array */
  34. cvSeqSort( features, (CvCmpFunc)feature_cmp, NULL );
  35. n = features->total;
  36. *feat = calloc( n, sizeof(struct feature) );
  37. *feat = cvCvtSeqToArray( features, *feat, CV_WHOLE_SEQ );
  38. for( i = 0; i < n; i++ )
  39. {
  40. free( (*feat)[i].feature_data );
  41. (*feat)[i].feature_data = NULL;
  42. }
  43.  
  44. cvReleaseMemStorage( &storage );
  45. cvReleaseImage( &init_img );
  46. release_pyr( &gauss_pyr, octvs, intvls + 3 );
  47. release_pyr( &dog_pyr, octvs, intvls + 2 );
  48. return n;
  49. }

这里的角度值是弧度值

通过计算特征向量的主曲率半径来判断特征是否是边缘which will导致不稳定,即去除边缘响应:

  1. static int is_too_edge_like( IplImage* dog_img, int r, int c, int curv_thr )
  2. {
  3. double d, dxx, dyy, dxy, tr, det;
  4.  
  5. /* principal curvatures are computed using the trace and det of Hessian */
  6. d = pixval32f(dog_img, r, c);
  7. dxx = pixval32f( dog_img, r, c+1 ) + pixval32f( dog_img, r, c-1 ) - 2 * d;
  8. dyy = pixval32f( dog_img, r+1, c ) + pixval32f( dog_img, r-1, c ) - 2 * d;
  9. dxy = ( pixval32f(dog_img, r+1, c+1) - pixval32f(dog_img, r+1, c-1) -
  10. pixval32f(dog_img, r-1, c+1) + pixval32f(dog_img, r-1, c-1) ) / 4.0;
  11. tr = dxx + dyy;
  12. det = dxx * dyy - dxy * dxy;
  13.  
  14. /* negative determinant -> curvatures have different signs; reject feature */
  15. if( det <= 0 )
  16. return 1;
  17.  
  18. if( tr * tr / det < ( curv_thr + 1.0 )*( curv_thr + 1.0 ) / curv_thr )
  19. return 0;
  20. return 1;
  21. }

calc_features_scales函数很简单,就是填充所有特征点对应的scl和scl_octv变量:

  1. static void calc_feature_scales( CvSeq* features, double sigma, int intvls )
  2. {
  3. struct feature* feat;
  4. struct detection_data* ddata;
  5. double intvl;
  6. int i, n;
  7.  
  8. n = features->total;
  9. for( i = 0; i < n; i++ )
  10. {
  11. feat = CV_GET_SEQ_ELEM( struct feature, features, i );
  12. ddata = feat_detection_data( feat );
  13. intvl = ddata->intvl + ddata->subintvl;
  14. feat->scl = sigma * pow( 2.0, ddata->octv + intvl / intvls );
  15. ddata->scl_octv = sigma * pow( 2.0, intvl / intvls );
  16. }
  17. }
  1. 函数adjust_for_img_dbl(),如果在开始的时候将图像dbl扩大了,这是就需要将特征点中的坐标值/2处理:
  1. n = features->total;
  2. for( i = 0; i < n; i++ )
  3. {
  4. feat = CV_GET_SEQ_ELEM( struct feature, features, i );
  5. feat->x /= 2.0;
  6. feat->y /= 2.0;
  7. feat->scl /= 2.0;
  8. feat->img_pt.x /= 2.0;
  9. feat->img_pt.y /= 2.0;
  10. }

在计算机中真是说不清‘2’这个数字有多重要,金字塔中也到处是它:)

下面是计算特征方向的函数:

  1. static void calc_feature_oris( CvSeq* features, IplImage*** gauss_pyr )
  2. {
  3. struct feature* feat;
  4. struct detection_data* ddata;
  5. double* hist;
  6. double omax;
  7. int i, j, n = features->total;
  8.  
  9. for( i = 0; i < n; i++ )
  10. {
  11. feat = malloc( sizeof( struct feature ) );
  12. cvSeqPopFront( features, feat );
  13. ddata = feat_detection_data( feat );
  14. hist = ori_hist( gauss_pyr[ddata->octv][ddata->intvl],
  15. ddata->r, ddata->c, SIFT_ORI_HIST_BINS,
  16. cvRound( SIFT_ORI_RADIUS * ddata->scl_octv ),
  17. SIFT_ORI_SIG_FCTR * ddata->scl_octv );
  18. for( j = 0; j < SIFT_ORI_SMOOTH_PASSES; j++ )
  19. smooth_ori_hist( hist, SIFT_ORI_HIST_BINS );
  20. omax = dominant_ori( hist, SIFT_ORI_HIST_BINS );
  21. add_good_ori_features( features, hist, SIFT_ORI_HIST_BINS,
  22. omax * SIFT_ORI_PEAK_RATIO, feat );
  23. free( ddata );
  24. free( feat );
  25. free( hist );
  26. }
  27. }

还是将每个特征取出来[函数cvSeqPopFront删除序列的头部元素],针对每个特征像素点统计其所在窗口图像中的方向梯度直方图,主要就是函数ori_hist():

aaarticlea/png;base64," alt="" />

直方图用一个double数组在存储,统计窗口图像中每个像素所在的dx dy ->梯度的角度和梯度的模,然后将角度转换为hist数组的index,累加值是梯度的模(距离加权后)。窗口的半径大小跟所在的尺度有关。

对得到的hist通过函数smooth_ori_hist()多次进行平滑,也是通过相加求平均的方法。

函数dominant_ori()用来求得直方图中值最大的那个方向的值,然后用这个值乘上一个系数作为阈值用于add_good_ori_fetures()函数:

  1. static void add_good_ori_features( CvSeq* features, double* hist, int n,
  2. double mag_thr, struct feature* feat )
  3. {
  4. struct feature* new_feat;
  5. double bin, PI2 = CV_PI * 2.0;
  6. int l, r, i;
  7.  
  8. for( i = 0; i < n; i++ )
  9. {
  10. l = ( i == 0 )? n - 1 : i-1;
  11. r = ( i + 1 ) % n;
  12.  
  13. if( hist[i] > hist[l] && hist[i] > hist[r] && hist[i] >= mag_thr )
  14. {
  15. bin = i + interp_hist_peak( hist[l], hist[i], hist[r] );
  16. bin = ( bin < 0 )? n + bin : ( bin >= n )? bin - n : bin;
  17. new_feat = clone_feature( feat );
  18. new_feat->ori = ( ( PI2 * bin ) / n ) - CV_PI;
  19. cvSeqPush( features, new_feat );
  20. free( new_feat );
  21. }
  22. }
  23. }

该函数通过遍历整个hist直方图中的所有方向,然后找到局部极值点并且满足阈值的,填充ori变量,构成新特征,然后将此特征再添加会队列中。(可能有多个满足条件的点)

----

好了至此,所有特征点的坐标、所在尺度、其方向都已经得到,就剩下构成特征向量了:

  1. static void compute_descriptors( CvSeq* features, IplImage*** gauss_pyr, int d, int n)
  2. {
  3. struct feature* feat;
  4. struct detection_data* ddata;
  5. double*** hist;
  6. int i, k = features->total;
  7.  
  8. for( i = 0; i < k; i++ )
  9. {
  10. feat = CV_GET_SEQ_ELEM( struct feature, features, i );
  11. ddata = feat_detection_data( feat );
  12. hist = descr_hist( gauss_pyr[ddata->octv][ddata->intvl], ddata->r,
  13. ddata->c, feat->ori, ddata->scl_octv, d, n );
  14. hist_to_descr( hist, d, n, feat );
  15. release_descr_hist( &hist, d );
  16. }
  17. }

这里的descr_hist函数也是计算特征点所在窗口中的梯度方向分布->由于需要具有旋转不变性的特征,所以这里的梯度方向是相对于上面检测出来的特征像素的主方向的角度差来统计的:

函数里面有个坐标变换和求角度差的过程

  1. static double*** descr_hist( IplImage* img, int r, int c, double ori,
  2. double scl, int d, int n )
  3. {
  4. double*** hist;
  5. double cos_t, sin_t, hist_width, exp_denom, r_rot, c_rot, grad_mag,
  6. grad_ori, w, rbin, cbin, obin, bins_per_rad, PI2 = 2.0 * CV_PI;
  7. int radius, i, j;
  8.  
  9. hist = calloc( d, sizeof( double** ) );
  10. for( i = 0; i < d; i++ )
  11. {
  12. hist[i] = calloc( d, sizeof( double* ) );
  13. for( j = 0; j < d; j++ )
  14. hist[i][j] = calloc( n, sizeof( double ) );
  15. }
  16.  
  17. cos_t = cos( ori );
  18. sin_t = sin( ori );
  19. bins_per_rad = n / PI2;
  20. exp_denom = d * d * 0.5;
  21. hist_width = SIFT_DESCR_SCL_FCTR * scl;
  22. radius = hist_width * sqrt(2) * ( d + 1.0 ) * 0.5 + 0.5;
  23. for( i = -radius; i <= radius; i++ )
  24. for( j = -radius; j <= radius; j++ )
  25. {
  26. /*
  27. Calculate sample's histogram array coords rotated relative to ori.
  28. Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e.
  29. r_rot = 1.5) have full weight placed in row 1 after interpolation.
  30. */
  31. c_rot = ( j * cos_t - i * sin_t ) / hist_width;
  32. r_rot = ( j * sin_t + i * cos_t ) / hist_width;
  33. rbin = r_rot + d / 2 - 0.5;
  34. cbin = c_rot + d / 2 - 0.5;
  35.  
  36. if( rbin > -1.0 && rbin < d && cbin > -1.0 && cbin < d )
  37. if( calc_grad_mag_ori( img, r + i, c + j, &grad_mag, &grad_ori ))
  38. {
  39. grad_ori -= ori;
  40. while( grad_ori < 0.0 )
  41. grad_ori += PI2;
  42. while( grad_ori >= PI2 )
  43. grad_ori -= PI2;
  44.  
  45. obin = grad_ori * bins_per_rad;
  46. w = exp( -(c_rot * c_rot + r_rot * r_rot) / exp_denom );
  47. interp_hist_entry( hist, rbin, cbin, obin, grad_mag * w, d, n );
  48. }
  49. }
  50.  
  51. return hist;
  52. }

遍历窗口中的每一个像素,获得其梯度的新的相对角度,然后在相对坐标系中重新计算梯度方向直方图。这里涉及到一个3次插值,首先新坐标中的row、col、orientation都是浮点数,对

于离散化的图像来说,并不是简单的将其转换为整型数据,要利用精确数据的小数部分对两侧的数据进行加权然后累加。总而言之就是首先获得特征点窗口图像区域的梯度方向直方图,然后

计算新的相对坐标系中的点(浮点数),利用浮点数的小数部分对原梯度直方图中的数据(row、col、ori)进行加权累加到新的梯度直方图中,详见函数interp_hist_entry():

  1. static void interp_hist_entry( double*** hist, double rbin, double cbin,
  2. double obin, double mag, int d, int n )
  3. {
  4. double d_r, d_c, d_o, v_r, v_c, v_o;
  5. double** row, * h;
  6. int r0, c0, o0, rb, cb, ob, r, c, o;
  7.  
  8. r0 = cvFloor( rbin );
  9. c0 = cvFloor( cbin );
  10. o0 = cvFloor( obin );
  11. d_r = rbin - r0;
  12. d_c = cbin - c0;
  13. d_o = obin - o0;
  14.  
  15. /*
  16. The entry is distributed into up to 8 bins. Each entry into a bin
  17. is multiplied by a weight of 1 - d for each dimension, where d is the
  18. distance from the center value of the bin measured in bin units.
  19. */
  20. for( r = 0; r <= 1; r++ )
  21. {
  22. rb = r0 + r;
  23. if( rb >= 0 && rb < d )
  24. {
  25. v_r = mag * ( ( r == 0 )? 1.0 - d_r : d_r );
  26. row = hist[rb];
  27. for( c = 0; c <= 1; c++ )
  28. {
  29. cb = c0 + c;
  30. if( cb >= 0 && cb < d )
  31. {
  32. v_c = v_r * ( ( c == 0 )? 1.0 - d_c : d_c );
  33. h = row[cb];
  34. for( o = 0; o <= 1; o++ )
  35. {
  36. ob = ( o0 + o ) % n;
  37. v_o = v_c * ( ( o == 0 )? 1.0 - d_o : d_o );
  38. h[ob] += v_o;
  39. }
  40. }
  41. }
  42. }
  43. }
  44. }

好了,至此得到了一个三维数组,row、col对应于窗口图像中点的坐标,ori对应于该位置上的直方图,该直方图的ori元素中的值是由相邻亚像素位置的梯度模值加权累加得到的,下面对

这个三维数组进行简单处理得到最终的特征描述descriptor:

  1. static void hist_to_descr( double*** hist, int d, int n, struct feature* feat )
  2. {
  3. int int_val, i, r, c, o, k = 0;
  4.  
  5. for( r = 0; r < d; r++ )
  6. for( c = 0; c < d; c++ )
  7. for( o = 0; o < n; o++ )
  8. feat->descr[k++] = hist[r][c][o];
  9.  
  10. feat->d = k;
  11. normalize_descr( feat );
  12. for( i = 0; i < k; i++ )
  13. if( feat->descr[i] > SIFT_DESCR_MAG_THR )
  14. feat->descr[i] = SIFT_DESCR_MAG_THR;
  15. normalize_descr( feat );
  16.  
  17. /* convert floating-point descriptor to integer valued descriptor */
  18. for( i = 0; i < k; i++ )
  19. {
  20. int_val = SIFT_INT_DESCR_FCTR * feat->descr[i];
  21. feat->descr[i] = MIN( 255, int_val );
  22. }
  23. }

首先简单的将三维存储的数据一维化,然后进行归一化,处理下较大的值,再次归一化,然后将浮点类型的数据展开成0~255的整型特征,这样该特征点对应的sift特征就提取完成了。

整个过程和HOG算法有很多类似的地方,尤其是三次线性插值的过程。

--------------------

至此将适当的处理下数据类型,释放相关的中间变量之后整个_sift_features()特征提取函数就完成了。在调用该函数的时候会传入feat特征的指针,会在_sift_featrues()函数内部进行

特征内存的分配。

SIFT学习笔记之二 特征提取的更多相关文章

  1. 《Java编程思想》学习笔记(二)——类加载及执行顺序

    <Java编程思想>学习笔记(二)--类加载及执行顺序 (这是很久之前写的,保存在印象笔记上,今天写在博客上.) 今天看Java编程思想,看到这样一道代码 //: OrderOfIniti ...

  2. Hibernate学习笔记(二)

    2016/4/22 23:19:44 Hibernate学习笔记(二) 1.1 Hibernate的持久化类状态 1.1.1 Hibernate的持久化类状态 持久化:就是一个实体类与数据库表建立了映 ...

  3. X-Cart 学习笔记(二)X-Cart框架1

    目录 X-Cart 学习笔记(一)了解和安装X-Cart X-Cart 学习笔记(二)X-Cart框架1 X-Cart 学习笔记(三)X-Cart框架2 X-Cart 学习笔记(四)常见操作 四.X- ...

  4. C#可扩展编程之MEF学习笔记(二):MEF的导出(Export)和导入(Import)

    上一篇学习完了MEF的基础知识,编写了一个简单的DEMO,接下来接着上篇的内容继续学习,如果没有看过上一篇的内容, 请阅读:http://www.cnblogs.com/yunfeifei/p/392 ...

  5. DuiLib学习笔记(二) 扩展CScrollbar属性

    DuiLib学习笔记(二) 扩展CScrollbar属性 Duilib的滚动条滑块默认最小值为滚动条的高度(HScrollbar)或者宽度(VScrollbar).并且这个值默认为16.当采用系统样式 ...

  6. guava 学习笔记(二) 瓜娃(guava)的API快速熟悉使用

    guava 学习笔记(二) 瓜娃(guava)的API快速熟悉使用 1,大纲 让我们来熟悉瓜娃,并体验下它的一些API,分成如下几个部分: Introduction Guava Collection ...

  7. Dynamic CRM 2013学习笔记(二十八)用JS动态设置字段的change事件、必填、禁用以及可见

    我们知道通过界面设置字段的change事件,是否是必填,是否可见非常容易.但有时我们需要动态地根据某些条件来设置,这时有需要通过js来动态地控制了. 下面分别介绍如何用js来动态设置.   一.动态设 ...

  8. Dynamic CRM 2013学习笔记(二十七)无代码 复制/克隆方法

    前面介绍过二种复制/克隆方法:<Dynamic CRM 2013学习笔记(十四)复制/克隆记录> 和<Dynamic CRM 2013学习笔记(二十五)JS调用web service ...

  9. .NET Remoting学习笔记(二)激活方式

    目录 .NET Remoting学习笔记(一)概念 .NET Remoting学习笔记(二)激活方式 .NET Remoting学习笔记(三)信道 参考:百度百科  ♂风车车.Net 激活方式概念 在 ...

随机推荐

  1. 数组排序方法(join()、reverse()、sort())

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  2. JavaScript有趣的知识点

    JavaScript中总有一些有趣的小知识,而且又是很容易犯错的.我把我遇到的慢慢罗列一下,方便大家避坑 typeof(null)返回的结果是 object " "变成布尔类型为t ...

  3. Java面向对象4(P~U)

    P    3-1 Point类的构造函数 (SDUT 2670) import java.util.Arrays; import java.util.Scanner; public class Mai ...

  4. 1558:聚会 ybt

    1558:聚会 ybt 题解(看似很难,其实要是摸清了实质这就是个大水题) 上题目 1558:聚会 时间限制: 1000 ms         内存限制: 524288 KB提交数: 82     通 ...

  5. MySQL数据分析-(14)表补充:字符集

    大家好,我是jacky朱元禄,很高兴继续跟大家学习<MySQL数据分析实战>,本节课程jacky分享的主题是表补充之字符集 在分享课程之前,jacky在跟大家强调一下逻辑的重要性,我们学习 ...

  6. VUE项目开发流程

    前期准备 安装npm 安装webpack\vue-cli(2.9.6版本--版本不同可能会导致以下一些目录结构以及错误解决办法不符合实际情况) 创建项目 初始化创建项目,项目名称.项目描述.拥有者等等 ...

  7. hive 常用参数

    hive.exec.max.created.files •说明:所有hive运行的map与reduce任务可以产生的文件的和 •默认值:100000  hive.exec.dynamic.partit ...

  8. kotlin set get

    1.类定义属性 默认是public的. 2.var 一个变量,也是就是属性,自动生成set get方法. 3.val 常量,没有set方法. 4. 延迟初始化属性        对于非空类型的属性是必 ...

  9. 如果你的电脑想升级并且支持m.2接口

      便宜啊,赶紧入手.   文章来源:刘俊涛的博客 欢迎关注,有问题一起学习欢迎留言.评论

  10. 数据库中的几个概念 - LGWR, ARCH,ASYNC,SYNC,AFFIRM

    双机热备(双机容错)就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务.当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务 双 ...