稀疏编码直方图----一种超越HOG的轮廓特征

该论文是一篇来自CMU 的CVPR2013文章，提出了一种基于稀疏编码的轮廓特征，简称HSC（Histogram of Sparse Code），并在目标检测中全面超越了HOG（Histogram of Gradient）本文介绍HSC的思路及其计算过程。

如图3所示，HSC方法种采用了疏编码原理来提取图像特征的方法，即根据学习得到的字典对图像块Patch进行重新编码。

算法主要包括了两部分，分别是字典学习和特征提取。

字典学习。

　　1. 类似于基于K-Means方法的字典学习，稀疏编码的字典学习室通过求解一个关于1范数的最优化问题。字典学习的步骤如下：

　　2. 初始化。假设字典的长度为M，图像小块的宽高大小为，其中p可以去（3,5,7,…）。

　　3. 图像小块获取。收集关于某一类目标的图像，然后将他们切成正方形的小块，宽高大小为，如图1所示。将图像小块按照图像灰度，先行后列的展成向量形式，于是图像小块的集合记为。

　　4. 字典学习。根据集合，学习得到最优的字典，字典的行列为，表示长度为的列向量，通过求解以下方程得到：

其中,表示长度为的列向量。此最优化问题可以通过现有的一些软件工具求解得到，如K-SVD方法，通过交替式的来求解最优D和X。论文中指定K为1。

　　5. 输出字典D。如图2所示。

图1、图像小块获取

图2、学习得到的字典

特征提取

　　1. 学习到字典之后，可利用字典对指定的图像进行特征的提取。提取的过程如下：

　　2. 初始化，给定一张图像，提取指定位置的特征，如图1所示，提取狗的特征，将狗分成若干个小单元块，简称为Cell。

　　3. 单元块的稀疏编码。如图1所示，对每个cell，记为y，进行稀疏编码。即已知y和字典D，求解其最优的稀疏表达x：注意x的维度和y是不相等的，x的维度是M列向量，x是y的一个稀疏的表达，x的元素只有少数是非零的。

　　4. 平滑稀疏解x。对x中的每个元素，四邻域的双线性插值。

　　5. 计算x单元块的16邻域单元块的平均单元块，即相应元素相加然后除以16。

　　6. 归一化平均单元块x。归一化直方图的方法是二范数归一化，即

　　7. 将所有归一化后的平均单元块，按照先行后列的顺序展开成向量，所得到的向量即为对应的HSC特征直方图。

图3、HSC特征提取流程

图片有些不清晰，附上word版本：HSC特征提取cvpr2013.zip

稀疏编码直方图----一种超越HOG的轮廓特征的更多相关文章

转载 deep learning：八（SparseCoding稀疏编码）
转载 http://blog.sina.com.cn/s/blog_4a1853330102v0mr.html Sparse coding: 本节将简单介绍下sparse coding(稀疏编码),因 ...
Sparsity稀疏编码（二）
为了更进一步的清晰理解大脑皮层对信号编码的工作机制(策略),需要把他们转成数学语言,因为数学语言作为一种严谨的语言,可以利用它推导出期望和要寻找的程式.本节就使用概率推理(bayes v ...
稀疏编码概率解释（基于1996年Olshausen与Field的理论）
一.Sparse Coding稀疏编码稀疏编码算法是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据.稀疏编码算法的目的就是找到一组基向量 ,使得我们能将输入向量表示为这些 ...
UFLDL深度学习笔记（七）拓扑稀疏编码与矩阵化
UFLDL深度学习笔记 (七)拓扑稀疏编码与矩阵化主要思路前面几篇所讲的都是围绕神经网络展开的,一个标志就是激活函数非线性:在前人的研究中,也存在线性激活函数的稀疏编码,该方法试图直接学习数据的特 ...
稀疏编码(Sparse Coding)的前世今生(二)
为了更进一步的清晰理解大脑皮层对信号编码的工作机制(策略),须要把他们转成数学语言,由于数学语言作为一种严谨的语言,能够利用它推导出期望和要寻找的程式.本节就使用概率推理(bayes views)的方 ...
JAVA实现Base64编码的三种方式
摘要: Javabase64编码的三种方式有如下三种方式: 方式一:commons-codec.jar Java代码 1. String base64String="whuang12 ...
Sparsity稀疏编码（三）
稀疏编码(sparse coding)和低秩矩阵(low rank)的区别上两个小结介绍了稀疏编码的生命科学解释,也给出一些稀疏编码模型的原型(比如LASSO),稀疏编码之前的探讨文章 ...
Sparsity稀疏编码（一）
稀疏编码来源于神经科学,计算机科学和机器学习领域一般一开始就从稀疏编码算法讲起,上来就是找基向量(超完备基),但是我觉得其源头也比较有意思,知道根基的情况下,拓展其应用也比较有底气.哲学.神经科学.计 ...
稀疏编码(Sparse Coding)的前世今生(一) 转自http://blog.csdn.net/marvin521/article/details/8980853
稀疏编码来源于神经科学,计算机科学和机器学习领域一般一开始就从稀疏编码算法讲起,上来就是找基向量(超完备基),但是我觉得其源头也比较有意思,知道根基的情况下,拓展其应用也比较有底气.哲学.神经科学.计 ...

随机推荐

Mysql储存过程4:mysql变量设置
默认全局变量是两个@@开头, 可用show variables查看所有默认变量: @@user #declare定义变量只能用在储存过程中 #declare 变量名数据类型可选类型 declare ...
Mysql中的primary key 与auto_increment
mysql> create table cc(id int auto_increment); ERROR (): Incorrect table definition; there can be ...
在Ubuntu上安装搜狗输入法
1.进入搜狗输入法官网 2.下载Linux版本,选择64bit 下载 3.等待下载的同时,进行系统配置进入系统设置->语言支持->进行更新(需要输入登录密码)->在键盘输入法系统选 ...
Tutorial 6: ViewSets & Routers
转载自:http://www.django-rest-framework.org/tutorial/6-viewsets-and-routers/ Tutorial 6: ViewSets & ...
scrollreveal(页面滚动显示动画插件支持手机)
scrollreveal.js是一款可以轻易实现桌面和移动浏览器元素随页面滚动产生动画的js插件.该插件通过配置可以在页面滚动,元素进入视口时产生炫酷的动画效果,同时还支持元素的3D效果,非常的实用. ...
<转>MYSQL数据库数据拆分之分库分表总结
数据存储演进思路一:单库单表单库单表是最常见的数据库设计,例如,有一张用户(user)表放在数据库db中,所有的用户都可以在db库中的user表中查到. 数据存储演进思路二:单库多表随着用户数量的 ...
Jmeter组件和属性（二）
Jmeter脚本开发原则简单.正确.高效.简单:去除无关的组件,同时能复用的尽量复用.正确:对脚本或者业务正确性进行必要的判断,不能少也不能多.(200),业务错误的情况下,也可能返回200,必须用 ...
hexdump related.
hexdump format strings Tue 13 December 2005 In tips. Ian Wienand More from the "things you'd le ...
ultra-console
console.__proto__.styleText = function (option) { if (!option) { console.groupCollapsed('请输入option') ...
【PAT】1014. 福尔摩斯的约会 (20)
1014. 福尔摩斯的约会 (20) 大侦探福尔摩斯接到一张奇怪的字条:“我们约会吧! 3485djDkxh4hhGE 2984akDfkkkkggEdsb s&hgsfdk d&Hy ...

稀疏编码直方图----一种超越HOG的轮廓特征

稀疏编码直方图----一种超越HOG的轮廓特征的更多相关文章

随机推荐

热门专题