Python中的sklearn--KFold与StratifiedKFold

KFold划分数据集的原理：根据n_split直接进行划分

StratifiedKFold划分数据集的原理：划分后的训练集和验证集中类别分布尽量和原数据集一样

#导入相关packages

from sklearn.model_selection import KFold

from sklearn.model_selection import StratifiedKFold

 1 import numpy as np

 2 from sklearn.model_selection import StratifiedKFold

 3 X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])

 4 y = np.array([0, 0, 1, 1])

 5 skf = StratifiedKFold(n_splits=2)

 6 skf.get_n_splits(X, y)

 7 >>>2

 8 print(skf)

 9 StratifiedKFold(n_splits=2, random_state=None, shuffle=False)

10 for train_index, test_index in skf.split(X, y):

11     print("TRAIN:", train_index, "TEST:", test_index)

12     X_train, X_test = X[train_index], X[test_index]    #返回数据框的方法 X_train = X.iloc[train_index]

13     y_train, y_test = y[train_index], y[test_index]

14 >>>TRAIN: [1 3] TEST: [0 2] #返回的是索引

15 >>>TRAIN: [0 2] TEST: [1 3]

Python中的sklearn--KFold与StratifiedKFold的更多相关文章

python中导入sklearn中模块提示ImportError: DLL load failed: 找不到指定的程序。
python版本:3.7 平台:windows 10 集成环境:Anaconda3.7 64位在jupyter notebook中导入sklearn的相关模块提示ImportError: DLL l ...
Python中的支持向量机SVM的使用（有实例）
除了在Matlab中使用PRTools工具箱中的svm算法,Python中一样可以使用支持向量机做分类.因为Python中的sklearn也集成了SVM算法. 一.简要介绍一下sklearn Scik ...
Python 中的实用数据挖掘
本文是 2014 年 12 月我在布拉格经济大学做的名为‘ Python 数据科学’讲座的笔记.欢迎通过 @RadimRehurek 进行提问和评论. 本次讲座的目的是展示一些关于机器学习的高级概念. ...
Scikit Learn: 在python中机器学习
转自:http://my.oschina.net/u/175377/blog/84420#OSC_h2_23 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的 ...
Python中T-SNE实现降维
Python中T-SNE实现降维 from sklearn.manifold import TSNE from sklearn.datasets import load_iris from sklea ...
Python中作Q-Q图（quantile-quantile Plot）
Q-Q图主要可以用来回答这些问题: 两组数据是否来自同一分布 PS:当然也可以用KS检验,利用python中scipy.stats.ks_2samp函数可以获得差值KS statistic和P值从而实 ...
如何在Python中从零开始实现随机森林
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 决策树可能会受到高度变异的影响,使得结果对所使用的特定测试数据而言变得脆弱. 根据您的测试数据样本构建多个模型(称为套袋)可以减少这种差异,但是 ...
Python中导入第三方声源库Acoular的逻辑解释以及Acoular的下载
[声明]欢迎转载,但请保留文章原始出处→_→ 秦学苦练:http://www.cnblogs.com/Qinstudy/ 文章来源:http://www.cnblogs.com/Qinstudy/p/ ...
入门系列之Scikit-learn在Python中构建机器学习分类器
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由信姜缘发表于云+社区专栏介绍机器学习是计算机科学.人工智能和统计学的研究领域.机器学习的重点是训练算法以学习模式并根据数据进行预 ...

随机推荐

HarmonyOS单模块编译与源码导读
我这里以3518的开发板为例进行讲解,3516的也是通用的. 下面是之前全量编译的脚本 python build.py ipcamera_hi3518ev300 -b debug HarmonyOS最 ...
Codeforces301D. Yaroslav and Divisors
题意:2e5的全排列每次询问一个区间有多少对数满足一个数是另一个数的倍数题解:考虑离线来做看到有个说法说在处理有两种约束的问题时一般用数据结构边插入边询问的方式这个题正是如此我们用su ...
【hdu 1573】X问题（数论--拓展欧几里德求解同余方程组的个数）
题目:求在小于等于N的正整数中有多少个X满足:X mod a[0] = b[0], X mod a[1] = b[1], X mod a[2] = b[2], -, X mod a[i] = b[i] ...
【uva 1612】Guess（算法效率，2种想法）
题意:已知 N 位选手的3题的预期得分,得分要不全拿,要不为0.且知道最后的实际名次,而且得分相同的选手,ID小的排在前面.问这样的名次可能吗.若可能,输出最后一名的最高可能得分.(N≤16384) ...
Java-Swing的JFrame的一些插件使用详解
JFrame介绍: 在 JFrame 对象中可以使用add方法添加 AWT 或者 Swing 组件. JFrame 有一个 Content Pane,窗口能显示的所有组件都是添加在这个 Content ...
zoj3593One Person Game (扩展欧几里德）
There is an interesting and simple one person game. Suppose there is a number axis under your feet. ...
POJ1142 Smith Numbers 暴力+分解质因子
题意:题目定义了一个史密斯数,这个数的定义是:一个合数的各个位置上加起来的和等于它的素因数所有位置上的数字加起来的和.比如: 4937775=3∗5∗5∗658374+9+3+7+7+7+5=3+5+ ...
js面向对象封装级联下拉菜单列表
本实例开发的级联下拉菜单是根据已有json数据创建的DOM元素.点击文本框后,显示一级菜单.如果菜单中包含子菜单,菜单右侧会有指示箭头.点击菜单之后,会再显示下一级菜单,以此类推.当菜单下无子菜单时, ...
redis如何实现高可用【主从复制、哨兵机制】
实现redis高可用机制的一些方法: 保证redis高可用机制需要redis主从复制.redis持久化机制.哨兵机制.keepalived等的支持. 主从复制的作用:数据备份.读写分离.分布式集群.实 ...
【论文笔记】AutoML for MCA on Mobile Devices——论文解读与代码解析
理论部分方法介绍本节将详细介绍AMC的算法流程.AMC旨在自动地找出每层的冗余参数. AMC训练一个强化学习的策略,对每个卷积层会给出其action(即压缩率),然后根据压缩率进行裁枝.裁枝后,A ...

Python中的sklearn--KFold与StratifiedKFold

Python中的sklearn--KFold与StratifiedKFold的更多相关文章

随机推荐

热门专题