PHOG特征

2016年7月13日 21:07:57

什么是PHOG

PHOG是Pyramid HOG(pyramid histogram of oriented gradient)的简称,是在图像尺寸固定的情况下,计算不同尺度下的特征(这一点有点绕,是指要计算HOG特征的区块的划分尺度在变化),将这些特征进行拼接得到PHOG特征,在论文[1,2]中被提出和使用,用来做图像分类。

PHOG原理

具体来讲,HOG特征描述的是一个区域,它可以是一个cell大小,也可以是一个windows大小,anyway,ROI内逐像素计算梯度方向,然后按预设将所有角度等分为若干份,每个像素点的梯度方向就划归到特定角度范围内,那么统计直方图中就把它算到对应的“统计立柱(bin)”里面去,术语叫做“投票”,其投票权值是像素点的梯度幅值。逐像素操作后得到一个统计直方图,它可以用一个一维向量表示。我们可以把这个向量叫做HOG特征。需要计算PHOG特征的图像其尺寸是固定的,但要计算HOG特征则可以对这个图片有不同尺度的划分:第一层,只有1个区域;第二层:分为2x2个区域;第三层:分为4x4个区域;...。在同一划分尺度图里面,每个区域算出一个HOG特征,按顺序进行拼接,得到当前尺度图的HOG特征;所有尺度图的HOG特征进行拼接,得到整个图像空间尺度金字塔的PHOG特征。

怎么求PHOG

用伪代码表示一下:

Input:
win:某图像区域
bins: 梯度方向(角度值)要划分到几个区域,即180°或360°要等分的数目。通常取360°和8等分
L: 尺度金字塔要搞几层?通常取3。表示除了原图尺度外,另外再算3个“原有1/2尺度”图像的HOG特征
Output:
PHOG:尺度金字塔所有层的HOG特征的拼接
Algorighm:
function HOG(area){
%计算某区域area的HOG特征
逐像素计算梯度方向(角度值)
按等分方向数量,将梯度方向划归到不同的区间,进行统计
统计得到的直方图,是一个向量
} function level_HOG(level){
%计算某层金字塔的HOG特征
将均等划分的若干个窗口,分别计算HOG特征
将这些HOG特征进行拼接
} function PHOG(win){
%计算某区域win的尺度金字塔的PHOG特征
逐层计算win的尺度金字塔的HOG特征
将这些HOG特征进行拼接
}

PHOG的维度

PHOG作为HOG的变种,也是一个描述符,在代码实现中就是一个一维向量。那么PHOG描述符的长度是多少?即,PHOG这个向量有多少维?

L=3, n=8时:

第0层是整图算HOG,1x8维的HOG特征

第1层是2x2划分,2x2x8维的HOG特征

第2层是4x4划分,4x4x8维的HOG特征

第3层是8x8划分,8x8x8维的HOG特征

因此,此时的phog_dimension=(1+4+16+64)x8=680维

source code

http://www.robots.ox.ac.uk/~vgg/research/caltech/phog.html

ref

[1] Bosch, A. , Zisserman, A. and Munoz, X.

Representing shape with a spatial pyramid kernel

Proceedings of the International Conference on Image and Video Retrieval (2007)

[2] Bosch, A. , Zisserman, A. and Munoz, X.

Image Classification using Random Forests and Ferns

Proceedings of the 11th International Conference on Computer Vision, Rio de Janeiro, Brazil (2007)

PHOG特征的更多相关文章

  1. zz致力于变革未来的智能技术

    有 R-CNN SPPNet Fast R-CNN Faster R-CNN ... 的论文翻译 现在已经不能访问了...     [私人整理]空间金字塔池化网络SPPNet详解 SPP-Net是出自 ...

  2. 卷积神经网络提取特征并用于SVM

    模式识别课程的一次作业.其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个.图片大小为16x16.要求必须使用SVM作为二分类的分类器. 本文重点是如何使用卷积神经网络(CNN)来提取 ...

  3. [占位-未完成]scikit-learn一般实例之十一:异构数据源的特征联合

    [占位-未完成]scikit-learn一般实例之十一:异构数据源的特征联合 Datasets can often contain components of that require differe ...

  4. PRINCE2特征(三)

    提到不确定性,可能很多从事项目管理相关工作的人都会感同身受,一系列临时性问题,比如:变更.延期.调整.计划赶不上变化.团队调整等的出现,都是项目中再正常不过的内容.但正常不等于合理,我们还是要去思考一 ...

  5. PRINCE2特征(二)

    英国体系环境下项目有什么特征(二) 今天又要和大家分享了,这个时间也是自己很喜欢的时刻.上次给大家分享的是英国体系下项目的特征之一:临时性.不知道大家还有没有印象,英国体系下项目的特征有五个,今天来给 ...

  6. P2特征(一)

    很多人在提到项目的特征,肯定能说出来很多的内容,但是在英国体系下,项目的特点有哪些呢?这些特点引深的内容又有什么深度的含义.         项目具有临时性:很多人都知道项目是临时的,结束了就团队成员 ...

  7. sift特征

    已经有很多博客已经将sift特征提取算法解释的很清楚了,我只是记录一些我不明白的地方,并且记录几个理解sift特征比较好的博客. 1. http://aishack.in/tutorials/sift ...

  8. sift特征源码

    先贴上我对Opencv3.1中sift源码的注释吧,虽然还有很多没看懂.先从detectAndCompute看起 void SIFT_Impl::detectAndCompute(InputArray ...

  9. kaggle入门2——改进特征

    1:改进我们的特征 在上一个任务中,我们完成了我们在Kaggle上一个机器学习比赛的第一个比赛提交泰坦尼克号:灾难中的机器学习. 可是我们提交的分数并不是非常高.有三种主要的方法可以让我们能够提高他: ...

随机推荐

  1. Eclipse和MyEclipse工程描述符.classpath和.project和.mymetadata详解aaaaaa(转)

    Eclipse和MyEclipse工程描述符.classpath和.project和.mymetadata详解(转) (2012-03-28 15:06:54) 转载▼ 标签: .mymetadata ...

  2. X200s,Debian 8(Jessie) 安装流水帐

    1. U盘启动安装 a. 因为无线网卡驱动是non-free,需要另外下载,对应X200s,文件是iwlwifi-5000-5.ucode,下完放到安装U盘的根目录下,安装时就不会再提示而是直接安装  ...

  3. PAT 1024. 科学计数法 (20)

    科学计数法是科学家用来表示很大或很小的数字的一种方便的方法,其满足正则表达式[+-][1-9]"."[0-9]+E[+-][0-9]+,即数字的整数部分只有1位,小数部分至少有1位 ...

  4. 2016shenyang-1002-HDU5893-List wants to travel-树链剖分+线段树维护不同区间段个数

    肯定先无脑树链剖分,然后线段树维护一段区间不同个数,再维护一个左右端点的费用. 线段树更新,pushDown,pushUp的时候要注意考虑链接位置的费用是否相同 还有就是树链剖分操作的时候,维护上一个 ...

  5. Python2.7-异常和工具

    来自<python学习手册第四版>第七部分,而且本书发布的时候3.1还未发布,所以针对本书的一些知识会有些滞后于python的版本,具体更多细节可以参考python的标准手册. 一.异常基 ...

  6. 读“日请求亿级的QQ会员AMS平台PHP7升级实践”博客心得笔记

    PHP7版本尚未普及,对于前辈们为了性能提升有勇气探索新技术敢于尝螃蟹的精神十分敬佩,倍受鼓舞. PHP7升级面临的风险和挑战 对于一个已经现网在线的大型公共Web服务来说,基础公共软件升级,通常是一 ...

  7. 二:【nopcommerce系列】Nop的文件结构,引用关系。如何编译打包部署等

    如果,你还没先看第一篇,先看看 一:[nopcommerce系列]Nop整体架构的简单介绍,在看nop代码之前,你需要懂哪些东西 如果你确定你已经看完了第一篇,并且真的理解 mvc.和autofac, ...

  8. 如何用 fiddler 代理调试本地手机页面

    最近在做移动端的页面,但是移动端的调试很蛋疼.虽然说 90% 的功能都能用 chrome 下的模拟器来模拟解决,但是剩余的 10% 却只能在真机上调试.比如说一两个像素的误差,比如说只有真机上才能重现 ...

  9. MATLAB调用C程序、调试和LDPC译码

    MATLAB是一个很好用的工具.利用MATLAB脚本进行科学计算也特别方便快捷.但是代码存在较多循环时,MATLAB运行速度极慢.如果不想放弃MATLAB中大量方便使用的库,又希望代码能迅速快捷的运行 ...

  10. .NET Core VS Code 环境配置

    VSCode .NET环境配置     在此之前我一直是使用notepad++配置的C/C#环境来写代码,比起打开"笨重"的VS要方便很多.VSCode出来之后,本来也想折腾了一下 ...