kNN是一种常见的监督学习方法.工作机制简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k各训练样本,然后基于这k个“邻居”的信息来进行预测,通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果:在回归任务中可以使用“平均法”,即将这k个样本的实值输出标记的平均值作为预测结果:还可以基于距离远近进行加权平均或加权投票,距离越近的样本权重越大.[1] kNN的伪代码如下:[2] 对未知类别属性的数据集中的每个点依次执行以下操作: (1)计算已知类别数据集…