K最近邻(K-Nearest-Neighbour,KNN)算法是机器学习里简单易掌握的一个算法.通过你的邻居判断你的类型,“近朱者赤,近墨者黑”表达了K近邻的算法思想. 一.算法描述: 1.1 KNN算法的原理 KNN算法的前提是存在一个样本的数据集,每一个样本都有自己的标签,表明自己的类型.现在有一个新的未知的数据,需要判断它的类型.那么通过计算新未知数据与已有的数据集中每一个样本的距离,然后按照从近到远排序.取前K个最近距离的样本,来判断新数据的类型. 通过两个例子来说明KNN算法的原理 (…