模型评估方法 假如我们有一个带标签的数据集D,我们如何选择最优的模型? 衡量模型好坏的标准是看这个模型在新的数据集上面表现的如何,也就是看它的泛化误差.因为实际的数据没有标签,所以泛化误差是不可能直接得到的.于是我们需要在数据集D上面划分出来一小部分数据测试D的性能,用它来近似代替泛化误差. 有三种方法可以进行上面的划分操作:留出法.交叉验证法.自助法. 留出法: 留出法的想法很简单,将原始数据直接划分为互斥的两类,其中一部分用来训练模型,另外一部分用来测试.前者就是训练集,后者就是测试集. 在…