所谓的KNN算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表. 这里举一个很简单的例子来理解一下KNN算法的原理,假设有以下数据,根据微信.电话.短信联系的次数将朋友进行归类为认识.普通.好友三个类别,如下: 根据A-J的特征来确定K应该属于哪一类朋友? 那么就可以用下面的代码来进行归类: #! /usr/bin/env python # enco…