最近在参加大数据的暑期培训,记录一下学习的东西. 引言 懒惰学习法:简单的存储数据,并且一直等待,直到给定一个检验数据,才进行范化,以便根据与存储的训练元组的相似性对该检验数据进行分类.懒惰学习法在 训练元组的时候只做少量的工作,而在进行分类或者数值预测时做更多的工作.由于懒惰学习法存储训练元组或实例,也被称为基于实例的学习法. K-近邻算法是简单的分类与回归方法,属于懒惰学习法. K-近邻算法的基本做法:给定一个训练数据集,在训练数据集中找到与未知实例最邻近的K个训练集中的实例,这K个实例的多…