数据集划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 训练数据和测试数据常用的比例一般为:70%: 30%, 80%: 20%, 75%: 25% sklearn数据集划分API: sklearn.model_selection.train_test_split 常用参数: 特征值和目标值 test_size:测试数据的大小,默认为0.25 返回值:训练数据特征值,测试数据特征值,训练数据目标值,测试数据目标值的元组…