在行为识别的iDT算法中,主要使用了HOG,HOF,MBH和Dense Trajectory四种特征.这里主要对前三者进行介绍. 1. HOG特征(histogram of gray) 此处HOG特征的介绍转载了zouxy09大神的文章  http://blog.csdn.NET/zouxy09/article/details/7929348/ 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子.…
iDT算法是行为识别领域中非常经典的一种算法,在深度学习应用于该领域前也是效果最好的算法.由INRIA的IEAR实验室于2013年发表于ICCV.目前基于深度学习的行为识别算法效果已经超过了iDT算法,但与iDT的结果做ensemble总还是能获得一些提升.所以这几年好多论文的最优效果都是"Our method+iDT"的形式. 此前由于项目原因,对iDT算法进行了很多研究和实验,故此处对其核心思路与一些实施的细节进行总结,方便后续回顾,也希望能够在此过程中获得一些新的启发. 介绍的内…
  Sparse Filtering 是一个用于提取特征的无监督学习算法,与通常特征学习算法试图建模训练数据的分布的做法不同,Sparse Filtering 直接对训练数据的特征分布进行分析,在所谓"好特征"的指导下构建目标函数来进行优化,其中只涉及一个可调参数.本文将主要讨论两个问题: (1)什么样的特征是好的特征: (2)如何利用好特征的条件来构造 Sparse Filtering 的目标函数. 目录链接 (一)网络结构与特征矩阵 (二)好特征的刻画 (三)目标函数的建立和求解…
形式化运算系统的研究: 图灵:提出图灵机形式系统,通过0,1运算系统来解决复杂问题: 冯诺依曼:提出了冯诺依曼体系:即通过修改内存反映运算结果: 阿隆左.丘奇:提出新的运算范型Lambda演算,计算机运算才是本质,修改内存只不过是这种运算规则的副作用: 后出现函数式语言的鼻祖:LISP; 函数式语言: 通过连续表达式运算求值的语言; 由于现在的计算机都是基于冯诺依曼体系建立的,所以函数式语言就是运行在解释环境而非编译环境的: 结果:大多数人都在使用基于冯诺依曼体系的命令式语言,但为了获得特别的计…
第七篇:字符特征 选择的字符特征应该满足以下条件: (1)选取的字符特征具有较强的鲁棒性,不受字符变形.弯曲等影响. (2)两个字符的字符特征不能完全相同,但部分相同是允许的,即选择的字符特征是唯一的,但是不能重复. (3)选取的字符特征要尽可能的提供字符的信息. (4)选择的字符特征提取方法易于实现,能够减少计算时间. 一般采用纹理.边缘特征.纹理特征是表示图像的另一种重要的视觉特征,纹理结构反映图像亮度的空间变化情况,具有局部与整体的自相似性.纹理是有纹理基元按某种确定性的规律或某种统计规律…
第二篇:车牌的特征及难点 2.1  对我国车牌的认识 我国目前使用的汽车牌号标准是 2007 年开始实施的<中华人民共和国机动车号牌>GA36-2007(2010 年修订).根据 GA36-2007 对机动车牌号编排规则规定,我国汽车的车牌构造特点如下: 汽车车牌号的编排规则:我国的标准车辆车牌是由一个省份汉字(军警车牌为其他汉字)后跟字母或阿拉伯数字组成的 7 个字序列.标准车牌的的具体排列格式是:X1X2·X3X4X5X6X7,X1是各省.直辖市的简称或军警,X2是英文字母,代表该汽车所在…
原地址:http://blog.csdn.net/watkinsong/article/details/7631241 目前因为做人脸识别的一个小项目,用到了AdaBoost的人脸识别算法,因为在网上找到的所有的AdaBoost的简介都不是很清楚,让我看看头脑发昏,所以在这里打算花费比较长的时间做一个关于AdaBoost算法的详细总结.希望能对以后用AdaBoost的同学有所帮助.而且给出了关于AdaBoost实现的一些代码.因为会导致篇幅太长,所以这里把文章分开了,还请见谅. 第二部分的地址请…
这里我们讲一下使用HOG的方法进行手写数字识别: 首先把 代码分享出来: hog1.m function B = hog1(A) %A是28*28的 B=[]; [x,y] = size(A); %外圈补0 A(:,y+) = ; A(x+,:) = ; :x deltax(:,i)=A(:,i+)-A(:,i); end :y deltay(i,:)=A(i+,:)-A(i,:); end : : Px=deltax(i*-:i*+,j*-:j*+); Py=deltay(i*-:i*+,j*…
SIFT尺度不变特征 D. Lowe. Distinctive image features from scale-invariant key points, IJCV 2004 -Lecture 05 - Scale-invariant Feature Transform (SIFT) - https://www.youtube.com/watch?v=NPcMS49V5hg 本文是上面UCF-CRCV课程视频的学习笔记. DOG(Difference of Gaussian)角点 / Har…
OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本文就学习一下基于开源软件和大厂服务的文字识别效果. 关于ocr的简介,请参考博客:https://www.cnblogs.com/wj-1314/p/9446756.html 刚入门不久,而且还是自己摸着石头过河,所以学的知识深一点,浅一点的,博客里面记录的是自己学习的过程,希望记录自己的学习之路,…