这里主要讲的是对分类模型的评估. 1.准确率(Accuracy) 准确率的定义是:[分类正确的样本] / [总样本个数],其中分类正确的样本是不分正负样本的 优点:简单粗暴 缺点:当正负样本分布不均衡的情况(假设一种极端情况,正样本1个,负样本99个),此时即使一个比较差的模型(只会将所用的样本预测成负样本),那它也有99%的准确率. 总结一下就是 当样本分布不均匀,该指标意义不大 改进方案: 1.在不同样本分类下求它的准确率,然后取平均值 2.选取其他评价指标 2.PR曲线 Precision…