from sklearn.datasets import make_classification创建分类数据集

make_classification创建用于分类的数据集，官方文档

例子：

### 创建模型

def create_model():

    # 生成数据

    from sklearn.datasets import make_classification

    X, y = make_classification(n_samples=10000,        # 样本个数

                               n_features=25,          # 特征个数

                               n_informative=3,        # 有效特征个数

                               n_redundant=2,          # 冗余特征个数（有效特征的随机组合）

                               n_repeated=0,           # 重复特征个数（有效特征和冗余特征的随机组合）

                               n_classes=3,            # 样本类别

                               n_clusters_per_class=1, # 簇的个数

                               random_state=0)

    print("原始特征维度",X.shape)

    # 读取数据

    print("读取数据")

    #import pandas as pd

    #data = pd.read_csv(datapath)

    # 数据划分

    print("数据划分")

    from sklearn.model_selection import train_test_split

    global x_train,x_valid,x_test,y_train,y_valid,y_test

    x_train,x_test,y_train,y_test = train_test_split(X,y,random_state = 33,test_size = 0.25)

    x_train,x_valid,y_train,y_valid = train_test_split(x_train,y_train,random_state = 33,test_size = 0.25)

    # 创建模型

    print("创建模型")

    from sklearn.linear_model import LogisticRegression

    global model

    model = LogisticRegression(penalty = 'l2').fit(x_train,y_train)

### 保存模型

def save_model():

    print("保存模型")

    from sklearn.externals import joblib

    joblib.dump(model,'model.pkl')

### 模型验证

def validate_model():

    print("模型验证")

    print(model.score(x_valid,y_valid))  

### 模型预测

def predict_model():

    print("模型预测")

    global pred

    pred = model.predict_proba(x_test)

    print(pred)

if __name__ == "__main__":

    create_model()

    save_model()

    validate_model()

    predict_model()

from sklearn.datasets import make_classification创建分类数据集的更多相关文章

实验一使用sklearn的决策树实现iris鸢尾花数据集的分类
使用sklearn的决策树实现iris鸢尾花数据集的分类要求: 建立分类模型,至少包含4个剪枝参数:max_depth.min_samples_leaf .min_samples_split.max ...
sklearn提供的自带的数据集
sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下载的数据集(Downloaded ...
Python——sklearn提供的自带的数据集
sklearn提供的自带的数据集 sklearn 的数据集有好多个种自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下 ...
【sklearn】网格搜索 from sklearn.model_selection import GridSearchCV
GridSearchCV用于系统地遍历模型的多种参数组合,通过交叉验证确定最佳参数. 1.GridSearchCV参数 # 不常用的参数 pre_dispatch 没看懂 refit 默认为Tr ...
【sklearn】from sklearn.extermals import joblib（保存模型和加载模型）
原创博文,转载请注明出处! sklearn中保存和加载模型的方法 1.载入模块 from sklearn.externals joblib. model = joblib. # -*- coding: ...
（数据科学学习手札21）sklearn.datasets常用功能详解
作为Python中经典的机器学习模块,sklearn围绕着机器学习提供了很多可直接调用的机器学习算法以及很多经典的数据集,本文就对sklearn中专门用来得到已有或自定义数据集的datasets模块进 ...
sklearn训练感知器用iris数据集
简化版代码 from sklearn import datasets import numpy as np #获取data和类标 iris = datasets.load_iris() X = iri ...
特征选取1-from sklearn.feature_selection import SelectKBest
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
sklearn datasets模块学习
sklearn.datasets模块主要提供了一些导入.在线下载及本地生成数据集的方法,可以通过dir或help命令查看,我们会发现主要有三种形式:load_<dataset_name>. ...

随机推荐

Linux权限控制
文件属性权限说明文件用户组调权限设置建议文件属性在shell环境里输入:ls -l 可以查看当前目录文件.如: drwxr-xr-x. 14 root root 4096 Apr 5 18: ...
docker教程目录
为什么要用 Docker 什么是 Docker Docker 镜像 Docker容器的运用 Docker仓库 Docker如何获取镜像 CentOS 安装Docker Docker 列出镜像 Dock ...
vue削笔机
// 1.vue 是异步更新dom // 2.vue修改多次状态,vue 只会渲染一次 // 3.vue变化侦查机制,每次状态的变化都会发出一个渲染信号. // 检查队列中是否存在,不存在将渲染操作添 ...
浏览器检测-js
昨天有一同学问我为什么attachEvent在非IE浏览器下不能起作用,我也跟他解释了一番:attachEvent是IE下独有的,只能在IE下使用,其他浏览器下应该用addEventListener来 ...
PIL中文文档
(0)http://hereson.iteye.com/blog/2224334 (1)http://blog.csdn.net/yjwx0018/article/details/52852067 ( ...
Ngix
Ngix安装官网地址,下载为源码,需要编译安装 http://nginx.org/ 环境 1.需要安装gcc的环境. yum install gcc-c++ 2.第三方的开发包. PCRE PCRE ...
Java Object类的方法
1. Java中所有的类都直接或者间接地继承自Object类.当没有显式地声名一个类的父类时,它会隐式地继承Object类. 2. Object类中定义了适合于任何Java对象的方法. String ...
http协议code码
301 永久重定向类似手机呼叫转移 302 临时重定向类似手机呼叫转移 403 forbidden ngnix怎么解决? 含义:表示你在请求一个资源文件,但是nginx不允许你查看. 原因1:访问 ...
【Error】：10061由于目标计算机积极拒绝，无法连接
之前Windows上连接mongodb的时候首先用mongod.exe启动程序之后,用mongo.exe来连接数据库.但是在连接的时候,出现如下错误: error:10061 由于目标计算机积极拒绝, ...
echarts在vue中使用的感悟
echarts在vue中使用的感悟 echarts作为图表展示的强大存在,每当使用后台系统,或多或少都会使用到,但是作为菜鸟的我,则是一路采坑,各种头大,比比皆是,为了避免下次再犯同样的错误,特意记录 ...

from sklearn.datasets import make_classification创建分类数据集

from sklearn.datasets import make_classification创建分类数据集的更多相关文章

随机推荐

热门专题