python实现HOG+SVM对CIFAR-10数据集分类（上）

本博客只用于学习，如果有错误的地方，恳请指正，如需转载请注明出处。

看机器学习也是有一段时间了，这两天终于勇敢地踏出了第一步，实现了HOG+SVM对图片分类,具体代码可以在github上下载，https://github.com/subicWang/HOG-SVM-classifer。大家都说HOG+SVM是在行人检测中很合拍的一对。至于为啥，我也讲不清楚。我猜想这么合拍的一对应用在图片分类上效果应该也不错吧，事实证明确实还行，速度挺快，分类正确率还行。我用的数据集是http://www.cs.toronto.edu/~kriz/cifar.html。图片特征HOG的提取过程，本文不做讲解，很多博客也肯定比我讲得清楚。那我就直接粘出我的代码吧，方便需要的人参考。

def getHOGfeat( image,stride = 8, orientations=8, pixels_per_cell=(8, 8),cells_per_block=(2, 2)):

    cx, cy = pixels_per_cell

    bx, by = cells_per_block

    sx, sy = image.shape

    n_cellsx = int(np.floor(sx // cx))  # number of cells in x

    n_cellsy = int(np.floor(sy // cy))  # number of cells in y

    n_blocksx = (n_cellsx - bx) + 1

    n_blocksy = (n_cellsy - by) + 1

    gx = zeros((sx, sy), dtype=np.double)

    gy = zeros((sx, sy), dtype=np.double)

    eps = 1e-5

    grad = zeros((sx, sy, 2), dtype=np.double)

    for i in xrange(1, sx-1):

        for j in xrange(1, sy-1):

            gx[i, j] = image[i, j-1] - image[i, j+1]

            gy[i, j] = image[i+1, j] - image[i-1, j]

            grad[i, j, 0] = arctan(gy[i, j] / (gx[i, j] + eps)) * 180 / math.pi

            if gx[i, j] < 0:

                grad[i, j, 0] += 180

            grad[i, j, 0] = (grad[i, j, 0] + 360) % 360

            grad[i, j, 1] = sqrt(gy[i, j] ** 2 + gx[i, j] ** 2)

    normalised_blocks = np.zeros((n_blocksy, n_blocksx, by * bx * orientations))

    for y in xrange(n_blocksy):

        for x in xrange(n_blocksx):

            block = grad[y*stride:y*stride+16, x*stride:x*stride+16]

            hist_block = zeros(32, dtype=double)

            eps = 1e-5

            for k in xrange(by):

                for m in xrange(bx):

                    cell = block[k*8:(k+1)*8, m*8:(m+1)*8]

                    hist_cell = zeros(8, dtype=double)

                    for i in xrange(cy):

                        for j in xrange(cx):

                            n = int(cell[i, j, 0] / 45)

                            hist_cell[n] += cell[i, j, 1]

                    hist_block[(k * bx + m) * orientations:(k * bx + m + 1) * orientations] = hist_cell[:]

            normalised_blocks[y, x, :] = hist_block / np.sqrt(hist_block.sum() ** 2 + eps)

    return normalised_blocks.ravel()

　熟悉HOG特征提取过程的应该都能看懂，我就不注释了。简单的这样实现当然不能满足我的要求，我一直不能理解为啥这些特征提取算法中像素点的梯度只由水平和垂直的像素决定，周围的其他点就对该点没有作用吗？对此我做了一些实验，在下一篇分享。

2020.4.5 更新：上面是三年前的代码了，当时写的有点不好导致好多人运行报错。今天重新改了一下，现在代码简介了很多，应该没啥问题。https://github.com/SubicLovePython/hog-svm

python实现HOG+SVM对CIFAR-10数据集分类（上）的更多相关文章

简单HOG+SVM mnist手写数字分类
使用工具 :VS2013 + OpenCV 3.1 数据集:minst 训练数据:60000张测试数据:10000张输出模型:HOG_SVM_DATA.xml 数据准备 train-images- ...
【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow
原网址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, ...
Hog SVM 车辆行人检测
HOG SVM 车辆检测近期需要对卡口车辆的车脸进行检测,首先选用一个常规的检测方法即是hog特征与SVM,Hog特征是由dalal在2005年提出的用于道路中行人检测的方法,并且取的了不错的识别效 ...
Python实现鸢尾花数据集分类问题——基于skearn的SVM
Python实现鸢尾花数据集分类问题——基于skearn的SVM 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = 'Xiaoli ...
第十八节、基于传统图像处理的目标检测与识别(HOG+SVM附代码)
其实在深度学习中我们已经介绍了目标检测和目标识别的概念.为了照顾一些没有学过深度学习的童鞋,这里我重新说明一次:目标检测是用来确定图像上某个区域是否有我们要识别的对象,目标识别是用来判断图片上这个对象 ...
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = ...
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression 一. 逻辑回归逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题, ...
【目标检测】基于传统算法的目标检测方法总结概述 Viola-Jones | HOG+SVM | DPM | NMS
"目标检测"是当前计算机视觉和机器学习领域的研究热点.从Viola-Jones Detector.DPM等冷兵器时代的智慧到当今RCNN.YOLO等深度学习土壤孕育下的GPU暴力美 ...
Python开发者最常犯的10个错误
Python是一门简单易学的编程语言,语法简洁而清晰,并且拥有丰富和强大的类库.与其它大多数程序设计语言使用大括号不一样 ,它使用缩进来定义语句块. 在平时的工作中,Python开发者很容易犯一些小错 ...

随机推荐

我的第一个python web开发框架（20）——产品发布（部署到服务器）
首先按上一章节所讲述的,将服务器环境安装好以后,接下来就是按步骤将网站部署到服务器上了. 我们的站点是前后端分离的,所以需要部署两个站点.首先来发布前端站点. 部署前端站点输入命令进入svn管理文件 ...
java序列化反序列化深入探究
When---什么时候需要序列化和反序列化: 简单的写一个hello world程序,用不到序列化和反序列化.写一个排序算法也用不到序列化和反序列化.但是当你想要将一个对象进行持久化写入文件,或者你想 ...
KEIL MDK 查看代码量、RAM使用情况--RO-data、RW-data、ZI-data
KEIL RVMDK编译后的信息 Code是代码占用的空间, RO-data是 Read Only 只读常量的大小,如const型, RW-data是(Read Write) 初始化了的可读写变量的大 ...
vim 命令大全 / vi 命令大全
vim 命令大全光标控制命令: 命令光标移动 h 向左移一个字符 j 向下移一行 k 向上移一行 l 向右移一个字符 G 移到文件的最后一行 w 移到下一个字的开头 W 移到下一个字的开头,忽略标 ...
邓_html_图片轮播
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...
PreparedStatement和Statement区别
在JDBC应用中,如果你已经是稍有水平开发者,你就应该始终以PreparedStatement代替Statement.也就是说,在任何时候都不要使用Statement 一.代码的可读性和可维护性. 虽 ...
rsync学习笔记
转载地址:http://www.cnblogs.com/maxincai/p/5142245.html rsync同步工具 1.rsync介绍 rsync是一款开源的.快速的.多功能的.可实现全量及增 ...
wigs的理解和应用
1. 首先了解下,Web应用的本质,大体如下: 1.浏览器发送一个HTTP请求: 2.服务器收到请求,生成一个HTML文档: 3.服务器把HTML文档作为HTTP响应的Body发送给浏览器: 4.浏览 ...
2017-07-10（lastlog rpm yum）
lastlog 查看所有用户最后一次登录的时间 rpm www.rpmfind.net 用来确认函数库需要安装哪个依赖程序的的网站 rpm -ivh 包全名 (安装) rpm -Uvh 包全名( ...
js_8_dom标签
创:9_3_2017 星期4 修: 对于在a标签中,如何阻止跳转? 定义一个事件,事件顺序执行后才执行跳转,如果事件函数返回false,则后面事件就不触发事件1 = "return 函数 ...

python实现HOG+SVM对CIFAR-10数据集分类（上）

python实现HOG+SVM对CIFAR-10数据集分类（上）的更多相关文章

随机推荐

热门专题