KNN——图像分类

内容参考自：https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit

用像素点的rgb值来判断图片的分类准确率并不高，但是作为一个练习knn的题目，还是挺不错的。

CIFAR-10是一个图像分类数据集。数据集包含60000张32*32像素的小图片，每张图片都有一个类别标注(总共有10类)，分成了50000张的训练集和10000张的测试集。

然后下载后得到的并不是实实在在的图片（不然60000张有点可怕...），而是序列化之后的，需要我们用代码来打开来获得图片的rgb值。

 import pickle

 def unpickle(file):

    with open(file, 'rb') as f:

    dict = pickle.load(f, encoding='latin1')

    return dict

由此得到的是一个字典，有data和labels两个值。

data：

一个10000*3072的numpy数组，这个数组的每一行存储了32*32大小的彩色图像。前1024个数是red，然后分别是green,blue。

labels：
一个范围在0-9的含有10000个数的一维数组。第i个数就是第i个图像的类标。

2. 基于曼哈顿距离的1NN分类

这个训练文件很大，如果全部读的话会占据很多内存...第一次全部读直接内存爆炸直接死机。所以这里我就读了一个文件的内容。

 #! /usr/bin/dev python

 # coding=utf-8

 import os

 import sys

 import pickle

 import numpy as np

 def load_data(file):

     with open(file, 'rb') as f:

         datadict = pickle.load(f, encoding='latin1')

         X = datadict['data']

         Y = datadict['labels']

         X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype('float')

         Y = np.array(Y)

         return X, Y

 def load_all(root):

     xs = []

     ys = []

     for n in range(1, 2):

         f = os.path.join(root, 'data_batch_%d' %(n,))

         X, Y = load_data(f)

         xs.append(X)

         ys.append(Y)

     X_train = np.concatenate(xs)   #转换为行向量

     Y_train = np.concatenate(ys)

     del X, Y

     X_test, Y_test = load_data(os.path.join(root, 'test_batch'))

     return X_train, Y_train, X_test, Y_test

 def classTest(Xtr_rows, Xte_rows, Y_train):

     count = 0

     numTest = Xte_rows.shape[0]

     result = np.zeros(numTest)   #构造一维向量的结果

     for i in range(numTest):

         distance = np.sum(np.abs(Xtr_rows - Xte_rows[i,:]), axis=1)

         min_dis = np.argmin(distance)

         result[i] = Y_train[min_dis]

         print('%d:  %d' %(count, result[i]))

         count += 1

     return result

 if __name__ == '__main__':

     X_train, Y_train, X_test, Y_test = load_all('D:\学习资料\机器学习\cifar-10-python\\')

     Xtr_rows = X_train.reshape(X_train.shape[0], 32 * 32 * 3)

     Xte_rows = X_test.reshape(X_test.shape[0], 32 * 32 * 3)

     result = classTest(Xtr_rows, Xte_rows, Y_train)

     print('accuracy: %f' % (np.mean(result == Y_test)))

最后测试结果如下：（跑了很久...）

3. KNN

有了上面的基础，接下来要实现最KNN就很简单了，保存与测试数据最接近的k个数据，最后选出最多的即可。

 def classTest(Xtr_rows, Xte_rows, Y_train, k):

     count = 0

     numTest = Xte_rows.shape[0]

     result = np.zeros(numTest)   #构造一维向量的结果

     for i in range(numTest):

         classCount = {}

         distance = np.sum(np.abs(Xtr_rows - Xte_rows[i,:]), axis=1)

         distance = distance.argsort()

         for j in range(k):

             votelabel = Y_train[distance[j]]

             classCount[votelabel] = classCount.get(votelabel, 0) + 1

             sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)

         result[i] = sortedClassCount[0][0]

         print('%d:  %d' % (count, result[i]))

         count += 1

     return result

4. 验证

对于如何确定一个最佳的k值，我们就需要去做验证，需要注意的是测试集不能作为验证集去验证。一般来说就是将训练数据分为两部分，一部分作为验证集去确定最佳的k值，最后再去用该k值去测试。

如果数据不是很多的话，那么就可以用交叉验证来寻找最佳的k值，交叉验证就是将数据分为多份，依次选一份作为验证集，比如将训练数据分为5分，然后进行5次训练，每次将其中一份作为验证集，另外四份作为训练集。

KNN——图像分类的更多相关文章

CS231n——图像分类（KNN实现）
图像分类目标:已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入图像. 图像分类流程输入:输入是包含N个图像的集合,每个图像的标签是K ...
【cs231n作业笔记】一：KNN分类器
安装anaconda,下载assignment作业代码作业代码数据集等2018版基于python3.6 下载提取码4put 本课程内容参考: cs231n官方笔记地址贺完结!CS231n官方笔记授 ...
基于Tensorflow + Opencv 实现CNN自定义图像分类
摘要:本篇文章主要通过Tensorflow+Opencv实现CNN自定义图像分类案例,它能解决我们现实论文或实践中的图像分类问题,并与机器学习的图像分类算法进行对比实验. 本文分享自华为云社区< ...
Atiti attilax主要成果与解决方案与案例rsm版 v4
Atiti attilax主要成果与解决方案与案例rsm版 v4 版本历史记录1 1. ##----------主要成果与解决方案与参与项目1 ###开发流程与培训系列1 #-----组织运营与文 ...
深度学习与计算机视觉系列(2)_图像分类与KNN
作者: 寒小阳 &&龙心尘时间:2015年11月. 出处: http://blog.csdn.net/han_xiaoyang/article/details/49949535 ht ...
图像分类与KNN
1 图像分类问题 1.1 什么是图像分类所谓图像分类问题,就是已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入图像.虽然看起来挺简单的,但这可 ...
Scikit-Learn实战KNN
Scikit-Learn总结 Scikit-Learn(基于Python的工具包) 1.是一个基于Numpy,Scipy,Matplotlib的开源机器学习工具包. 2.该包于2007年发起,基本功能 ...
CS231n学习笔记-图像分类笔记（下篇）
原文地址:智能单元 K-Nearest Neighbor分类器大家可能注意到了,为什么只用最相似的一张图片的标签来作为测试图像的标签呢?这不是很奇怪吗!是的,使用K-Nearest Neighbor ...
【cs231n】图像分类-Linear Classification线性分类
[学习自CS231n课程] 转载请注明出处:http://www.cnblogs.com/GraceSkyer/p/8824876.html 之前介绍了图像分类问题.图像分类的任务,就是从已有的固定分 ...

随机推荐

golang学习笔记8 beego参数配置打包linux命令
golang学习笔记8 beego参数配置打包linux命令参数配置 - beego: 简约 & 强大并存的 Go 应用框架https://beego.me/docs/mvc/contro ...
webview相关知识
标签类 1.Web App 建议用的样式用于覆盖 WebView 默认的样式,使得 App 看起来更像原生的 App,——“不露出马脚” /* document.documentElement.st ...
AtCoder Beginner Contest 082 B - Two Anagrams
题目链接:https://abc082.contest.atcoder.jp/tasks/abc082_b Time limit : 2sec / Memory limit : 256MB Score ...
写出优质Java代码的4个技巧
我们平时的编程任务不外乎就是将相同的技术套件应用到不同的项目中去,对于大多数情况来说,这些技术都是可以满足目标的.然而,有的项目可能需要用到一些特别的技术,因此工程师们得深入研究,去寻找那些最简单但最 ...
RTP协议全解析（H264码流和PS流）（转）
源: RTP协议全解析(H264码流和PS流)
用Java实现MVPtree——MVPtree核心算法代码的搭建
项目需要,需要把MVPtree这种冷门的数据结构写入Java,然网上没有成形的Java实现,虽说C++看惯了不过对C++实现复杂结构也是看得蒙蔽,幸好客户给了个github上job什么的人用Java写 ...
JS截取字符串中数字
今天项目中需要在一个字符串中截取一个数字,然后数字参与运算.搜了一下,有好多好用的方式截取字符串. 1,使用parseInt() var str ="4500元"; var num ...
从percona server 5.7换到mariadb 10.2
过去两年半一直推荐使用percona server,今天开始,因为一些mysql迟迟不不愿意支持的特性,打算换回mariadb 10.2了,具体哪些不说了,总之非常关键,mariadb都支持一两年了, ...
indexOf()/equals/contains
indexOf():对大小写敏感定义:返回某个指定字符串值在字符串中首次出现位置用法:返回字符中indexof(string)中字串string在父串中首次出现的位置,从0开始!没有返回-1:方便判断 ...
mysql添加Federated引擎问题
现在我有这么一个需求, 就是有两个项目, 一个叫项目A,一个项目B, 由于A的用户表和B的用户表是要实现一样的. 例如: 我在A项目中注册了,要实现在B项目中也能登录, 当用到B的时候, 由于B数据库 ...

KNN——图像分类

KNN——图像分类的更多相关文章

随机推荐

热门专题