【cs231n】图像分类 k-Nearest Neighbor Classifier(K最近邻分类器)【python3实现】

【学习自CS231n课程】

转载请注明出处：http://www.cnblogs.com/GraceSkyer/p/8763616.html

k-Nearest Neighbor（KNN）分类器

　　与其只找最相近的那1个图片的标签，我们找最相似的k个图片的标签，然后让他们针对测试图片进行投票，最后把票数最高的标签作为对测试图片的预测。所以当k=1的时候，k-Nearest Neighbor分类器就是Nearest Neighbor分类器。从直观感受上就可以看到，更高的k值可以让分类的效果更平滑，使得分类器对于异常值更有抵抗力。

　　【或者说，用这种方法来检索相邻数据时，会对噪音产生更大的鲁棒性，即噪音产生不确定的评价值对评价结果影响很小。】

　　上面例子使用了训练集中包含的2维平面的点来表示，点的颜色代表不同的类别或不同的类标签，这里有五个类别。不同颜色区域代表分类器的决策边界。这里我们用同样的数据集，使用K=1的最近邻分类器，以及K=3、K=5。K=1时（即最近邻分类器），是根据相邻的点来切割空间并进行着色；K=3时，绿色点簇中的黄色噪点不再会导致周围的区域被划分为黄色，由于使用多数投票，中间的整个绿色区域，都将被分类为绿色；k=5时，蓝色和红色区域间的这些决策边界变得更加平滑好看，它针对测试数据的泛化能力更好。

【注：白色区域表示这个区域中没有获得K-最近邻的投票，你或许可以假设将其归为一个类别，表示这些点在这个区域没有最近的其他点】

建议：去网站上尝试用KNN分类你自己的数据，改变K值，改变距离度量，来培养决策边界的直觉。

网址：http://vision.stanford.edu/teaching/cs231n-demos/knn/

超参数的选择

　　在实际中，大多使用k-NN分类器，但是K值如何确定？距离度量如何选择？向K值和距离度量这样的选择，被称为超参数（hyperparameter）。问题在于，在时间中该如何设置这些超参数。

　　× 你首先可能想到的是，选择能对你的训练集给出最高准确率，表现最佳的超参数，这是糟糕的做法！例如：在之前的k-最近邻分类算法中，假设k=1，我们总能完美分类训练集数据，我们便采用了这个策略...但之前实践中让K取更大的值，尽管在训练集中分错个别数据，但对于在训练集中未出现过的数据分类性能更佳，可见K=1并不合适。【在机器学习中，我们关心的不是要尽可能拟合训练集，而是要让我们的分类器以及方法，在训练集以外的未知数据上表现得更好。】

　　 × 你或许又会想，把所有的数据分成两部分：训练集和测试集。然后在训练集上用不同的超参数来训练算法，然后将训练好的分类器用在测试集上，再选择一组在测试集上表现最好的超参数。这也很糟糕！如果采用这种方法，那么很可能我们选择了一组超参，只是让我们的算法在这组测试集上表现良好，但是这组测试集的表现无法代表在全新的数据上的表现。所以，不要用测试集去调整参数，容易使得你的模型过拟合。【机器学习系统的目的，是让我们了解算法表现究竟如何，所以，测试集的目的是给我们一种预估方法，即在没遇到的数据上算法表现将会如何。】

　　√ 更常见的做法，就是将数据分为三组：训练集（大部分数据），验证集（从训练集中取出一小部分数据用来调优），测试集。我们在训练集上用不同超参来训练算法，在验证集上进行评估，然后用一组超参（选择在验证集上表现最好的）。然后，当完成了这些步骤以后，再把这组在验证集上表现最佳的分类器拿出来，在测试集上跑一跑。这个数据才是告诉你，你的算法在未见的新数据上表现如何。非常重要的一点是，必须分割验证集和测试集，所以当我们做研究报告时，往往只是在最后一刻才会接触到测试集。

　　以CIFAR-10为例，我们可以用49000个图像作为训练集，用1000个图像作为验证集。验证集其实就是作为假的测试集来调优。

代码实现：

 import numpy as np

 import pickle

 import os

 class KNearestNeighbor(object):

     def __init__(self):

         pass

     def train(self, X, y):

         """ X is N x D where each row is an example. Y is 1-dimension of size N """

         # the nearest neighbor classifier simply remembers all the training data

         self.Xtr = X

         self.ytr = y

     def predict(self, X, k=1):

         """ X is N x D where each row is an example we wish to predict label for """

         """ k is the number of nearest neighbors that vote for the predicted labels."""

         num_test = X.shape[0]

         # lets make sure that the output type matches the input type

         Ypred = np.zeros(num_test, dtype=self.ytr.dtype)

         # loop over all test rows

         for i in range(num_test):

             # using the L1 distance (sum of absolute value differences)

             distances = np.sum(np.abs(self.Xtr - X[i, :]), axis=1)

             # L2 distance:

             # distances = np.sqrt(np.sum(np.square(self.Xtr - X[i, :]), axis=1))

             indexes = np.argsort(distances)

             Yclosest = self.ytr[indexes[:k]]

             cnt = np.bincount(Yclosest)

             Ypred[i] = np.argmax(cnt)

         return Ypred

 def load_CIFAR_batch(file):

     """ load single batch of cifar """

     with open(file, 'rb') as f:

         datadict = pickle.load(f, encoding='latin1')

         X = datadict['data']

         Y = datadict['labels']

         X = X.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float")

         Y = np.array(Y)

     return X, Y

 def load_CIFAR10(ROOT):

     """ load all of cifar """

     xs = []

     ys = []

     for b in range(1, 6):

         f = os.path.join(ROOT, 'data_batch_%d' % (b, ))

         X, Y = load_CIFAR_batch(f)

         xs.append(X)

         ys.append(Y)

     Xtr = np.concatenate(xs)  # 使变成行向量

     Ytr = np.concatenate(ys)

     del X, Y

     Xte, Yte = load_CIFAR_batch(os.path.join(ROOT, 'test_batch'))

     return Xtr, Ytr, Xte, Yte

 Xtr, Ytr, Xte, Yte = load_CIFAR10('data/cifar-10-batches-py/')  # a magic function we provide

 # flatten out all images to be one-dimensional

 Xtr_rows = Xtr.reshape(Xtr.shape[0], 32 * 32 * 3)  # Xtr_rows becomes 50000 x 3072

 Xte_rows = Xte.reshape(Xte.shape[0], 32 * 32 * 3)  # Xte_rows becomes 10000 x 3072

 # assume we have Xtr_rows, Ytr, Xte_rows, Yte as before

 # recall Xtr_rows is 50,000 x 3072 matrix

 Xval_rows = Xtr_rows[:1000, :]  # take first 1000 for validation

 Yval = Ytr[:1000]

 Xtr_rows = Xtr_rows[1000:, :]  # keep last 49,000 for train

 Ytr = Ytr[1000:]

 # find hyperparameters that work best on the validation set

 validation_accuracies = []

 for k in [1, 3, 5, 10, 20, 50, 100]:

     # use a particular value of k and evaluation on validation data

     nn = KNearestNeighbor()

     nn.train(Xtr_rows, Ytr)

     # here we assume a modified NearestNeighbor class that can take a k as input

     Yval_predict = nn.predict(Xval_rows, k=k)

     acc = np.mean(Yval_predict == Yval)

     print('accuracy: %f' % (acc,))

     # keep track of what works on the validation set

     validation_accuracies.append((k, acc))

这代码我有空的话再完善吧......没空(

程序结束后，我们会作图分析出哪个k值表现最好，然后用这个k值来跑真正的测试集，并作出对算法的评价。

把训练集分成训练集和验证集。使用验证集来对所有超参数调优。最后只在测试集上跑一次并报告结果。

交叉验证

　　设定超参数的另一个策略是交叉验证。这在小数据集中更常用一些，在深度学习中不那么常用。当我们训练大型模型时，训练本身非常消耗计算能力，因此这个方法实际上不常用。

　　还是用刚才的例子，如果是交叉验证集，我们就不是取1000个图像，而是将训练集平均分成5份，其中4份用来训练，1份用来验证。然后我们循环着取其中4份来训练，其中1份来验证，最后取所有5次验证结果的平均值作为算法验证结果。

下图是5份交叉验证对k值调优的例子。针对每个k值，得到5个准确率结果，取其平均值，然后对不同k值的平均表现画线连接。本例中，当k=7的时算法表现最好（对应图中的准确率峰值）。如果我们将训练集分成更多份数，直线一般会更加平滑（噪音更少）。

实际应用：

　　在实际情况下，人们不是很喜欢用交叉验证，主要是因为它会耗费较多的计算资源。一般直接把训练集按照50%-90%的比例分成训练集和验证集。但这也是根据具体情况来定的：如果超参数数量多，你可能就想用更大的验证集，而验证集的数量不够，那么最好还是用交叉验证吧。至于分成几份比较好，一般都是分成3、5和10份。

　　常用的数据分割模式。给出训练集和测试集后，训练集一般会被均分。这里是分成5份。前面4份用来训练，黄色那份用作验证集调优。如果采取交叉验证，那就各份轮流作为验证集。最后模型训练完毕，超参数都定好了，让模型跑一次（而且只跑一次）测试集，以此测试结果评价算法。

KNN的劣势：

其实，KNN在图像分类中很少用到，原因如下：

它在测试时运算时间很长，这和我们刚才提到的需求不符，
像欧几里得距离或者L1距离这样的衡量标准用在比较图像上不太合适，这种向量化的距离函数，不太适合表示图像之间视觉的相似度。
它并不能体现图像之间的语义差别，更多的是图像的背景，色彩的差异。
K-近邻算法还有另一个问题，我们称之为“维度灾难”。 K-近邻分类器，它有点像是用训练数据把样本空间分成几块，这意味着，如果我们希望分类器有好的效果，我们需要训练数据能密集地分布在空间中，否则最近邻点的实际距离可能很远，也就是说，和待测样本的相似性没有那么高。而问题在于，想要密集地分布在空间中，我们需要指数倍地训练数据，这很糟糕，我们根本不可能拿到那么多的图片去密布这样的高维空间里的像素。

参考：

https://www.bilibili.com/video/av17204303/?from=search&seid=6625954842411789830

https://zhuanlan.zhihu.com/p/20900216?refer=intelligentunit

【cs231n】图像分类 k-Nearest Neighbor Classifier(K最近邻分类器)【python3实现】的更多相关文章

【cs231n】图像分类-Nearest Neighbor Classifier(最近邻分类器)【python3实现】
[学习自CS231n课程] 转载请注明出处:http://www.cnblogs.com/GraceSkyer/p/8735908.html 图像分类: 一张图像的表示:长度.宽度.通道(3个颜色通道 ...
K Nearest Neighbor 算法
文章出处:http://coolshell.cn/articles/8052.html K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KN ...
K NEAREST NEIGHBOR 算法(knn)
K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法.其中的K表示最接近自己的K个数据样本.KNN算法和K-M ...
K nearest neighbor cs229
vectorized code 带来的好处. import numpy as np from sklearn.datasets import fetch_mldata import time impo ...
K-Means和K Nearest Neighbor
来自酷壳: http://coolshell.cn/articles/7779.html http://coolshell.cn/articles/8052.html
[机器学习系列] k-近邻算法（K–nearest neighbors）
C++ with Machine Learning -K–nearest neighbors 我本想写C++与人工智能,但是转念一想,人工智能范围太大了,我根本介绍不完也没能力介绍完,所以还是取了他的 ...
机器学习笔记（十）---- KNN（K Nearst Neighbor）
KNN是一种常见的监督学习算法,工作机制很好理解:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个"邻居"的信息来进行预测.总结一句话就是&quo ...
最近邻分类器，K近邻分类器，线性分类器
转自:https://blog.csdn.net/oldmao_2001/article/details/90665515 最近邻分类器: 通俗来讲,计算测试样本与所有样本的距离,将测试样本归为距离最 ...
CS231n——图像分类（KNN实现）
图像分类目标:已有固定的分类标签集合,然后对于输入的图像,从分类标签集合中找出一个分类标签,最后把分类标签分配给该输入图像. 图像分类流程输入:输入是包含N个图像的集合,每个图像的标签是K ...

随机推荐

ABP学习入门系列（五）（展示实现增删改查）
大致要实现的效果如下 1,添加Controller(用到的X.PagedList 注意到nuget添加) using System.Web.Mvc; using Abp.Application.Se ...
Navbar和Tabbar常用设置
1.navBar [self.navigationController.navigationBar setBackgroundImage:navBarImage forBarMetrics:UIBar ...
SpringBoot+JPA+cache入门
在pom.xml中加入如下依赖 <dependency> <groupId>org.springframework.boot</groupId> <artif ...
Java Tools &Tools APIs
java 启动Java应用程序 javac Java编译器javac读取用Java编写的源文件,并将它们编译为字节码类文件. 用法: javac <options> <source ...
C# NPOI 导出Execl 工具类
NPOI 导出Execl 自己单独工具类详见代码 using System; using System.Collections.Generic; using System.Linq; using S ...
拜拜了,浮动布局-基于display:inline-block的列表布局——张鑫旭
一.一抹前言没有爱的日子,时间如指尖细沙,不知不觉就流逝了.写“CSS float浮动的深入研究.详解及拓展(一)”和“CSS float浮动的深入研究.详解及拓展(二)”似乎就在不久前,然而相隔差 ...
AJAX异步的 JavaScript
什么是AJAX: AJAX = Asynchronous JavaScript and XML(异步的 JavaScript 和 XML). AJAX 不是新的编程语言,而是一种使用现有标准的新方法. ...
C语言程序设计基础知识点概括
C语言程序设计基础知识点概括 C语言程序设计基础知识点1.函数是C语言的基本构成单位.main函数是C语言程序的唯一入口.2.C语言程序开发过程. 编译过程:将以.c或.cpp结尾的源程序文件经过编译 ...
行内元素和块级元素的具体区别是什么？inline-block是什么？（面试题目）
一,行内元素与块级元素的区别: 1.行内元素与块级元素直观上的区别二.行内元素与块级元素的三个区别行内元素会在一条直线上排列(默认宽度只与内容有关),都是同一行的,水平方向排列. 块级元素各占据一行 ...
Material适配2 - 高级篇
版权声明: 欢迎转载,但请保留文章原始出处作者:GavinCT 出处:http://www.cnblogs.com/ct2011/p/4493439.html 继续Material系列,先从Tool ...

【cs231n】图像分类 k-Nearest Neighbor Classifier(K最近邻分类器)【python3实现】

【学习自CS231n课程】

【cs231n】图像分类 k-Nearest Neighbor Classifier(K最近邻分类器)【python3实现】的更多相关文章

随机推荐

热门专题