训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。

比如，我们根据房源样本数据训练了一下房价模型，当用户输入自己的房子后，我们就需要根据训练好的房价模型来预测用户房子的价格。

这样就需要在训练模型后把模型保存起来，在使用模型时把模型读取出来对输入的数据进行预测。

这里保存和读取模型有两种方法，都非常简单，差别在于保存和读取速度的快慢上，因为有一个是利用了多进程机制，下面我们分别来看一下。

创建模型

首先我们创建模型并训练数据：

from sklearn.datasets import load_digits

from sklearn.svm import SVC

# 加载数据

digits = load_digits()

X = digits.data

y = digits.target

model = SVC()

model.fit(X, y)

用pickle读写模型

pickle是python中用于数据序列化的模块，因此，对于模型的序列化也可以用此模块来进行：

import pickle

# 以写二进制的方式打开文件

file = open("D:/data/python/model.pickle", "wb")

# 把模型写入到文件中

pickle.dump(model, file)

# 关闭文件

file.close()

这样会创建D:/data/python/model.pickle的文件，大家可以自己去尝试下看看，我这边生成的文件大概1M左右。

有了模型文件之后，在进行预测时我们就不需要进行训练了，而只要把这个训练好的模型文件读取出来，然后直接进行预测就可以：

import pickle

# 以读二进制的方式打开文件

file = open("D:/data/python/model.pickle", "rb")

# 把模型从文件中读取出来

model = pickle.load(file)

# 关闭文件

file.close()

# 用模型进行预测

from sklearn.datasets import load_digits

digits = load_digits()

X = digits.data

y = digits.target

print("预测值：", model.predict(X[15:20]))

print("实际值：", y[15:20])

输出为：

预测值： [5 6 7 8 9]

实际值： [5 6 7 8 9]

用joblib进行模型的读写

直接上代码：

from sklearn.datasets import load_digits

from sklearn.svm import SVC

# 用模型进行训练

digits = load_digits()

X = digits.data

y = digits.target

model = SVC()

model.fit(X, y)

# 用joblib保存模型

from sklearn.externals import joblib

joblib.dump(model, "D:/data/python/model.joblib")

这样就会生成D:/data/python/model.joblib文件，看起来比pickle生成的文件大一点点。

读取模型：

# 用joblib读取模型

from sklearn.externals import joblib

model = joblib.load("D:/data/python/model.joblib")

# 对数据进行预测

from sklearn.datasets import load_digits

digits = load_digits()

X = digits.data

y = digits.target

print("预测值：", model.predict(X[15:20]))

print("实际值：", y[15:20])

输出为：

预测值： [5 6 7 8 9]

实际值： [5 6 7 8 9]

看起来也很简单，同pickle的区别是joblib会以多进程方式来进行，据说性能会好些。

转sklearn保存模型的更多相关文章

sklearn保存模型-【老鱼学sklearn】
训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步. 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要 ...
sklearn保存模型的两种方式
sklearn 中模型保存的两种方法一. sklearn中提供了高效的模型持久化模块joblib,将模型保存至硬盘. from sklearn.externals import joblib # ...
sklearn保存模型
# View more python tutorials on my Youtube and Youku channel!!! # Youtube video tutorial: https://ww ...
【sklearn】from sklearn.extermals import joblib（保存模型和加载模型）
原创博文,转载请注明出处! sklearn中保存和加载模型的方法 1.载入模块 from sklearn.externals joblib. model = joblib. # -*- coding: ...
Python 3 利用 Dlib 19.7 和 sklearn机器学习模型实现人脸微笑检测
0.引言利用机器学习的方法训练微笑检测模型,给一张人脸照片,判断是否微笑: 使用的数据集中69张没笑脸,65张有笑脸,训练结果识别精度在95%附近: 效果: 图1 示例效果工程利用pytho ...
caffe使用ctrl-c不能保存模型
caffe使用Ctrl-c 不能保存模型: 是因为使用的是 tee输出日志解决方法:kill -s SIGINT <proc_id> 或者使用 GLOG_log_dir=/path/to ...
pytorch加载和保存模型
在模型完成训练后,我们需要将训练好的模型保存为一个文件供测试使用,或者因为一些原因我们需要继续之前的状态训练之前保存的模型,那么如何在PyTorch中保存和恢复模型呢? 方法一(推荐): 第一种方法也 ...
PyTorch保存模型与加载模型+Finetune预训练模型使用
Pytorch 保存模型与加载模型 PyTorch之保存加载模型参数初始化参数的初始化其实就是对参数赋值.而我们需要学习的参数其实都是Variable,它其实是对Tensor的封装,同时提供了da ...
（原）tensorflow保存模型及载入保存的模型
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/7198773.html 参考网址: http://stackoverflow.com/questions ...

随机推荐

windows 环境内网超快同步 DFS
记录下: 在WINDOWS环境下,内网同步使用DFS可以超快实现文件同步,效果非常OK 纯粹记录下!
HTML5标签canvas图像处理
摘要: canvas可以读取图片后,使用drawImage方法在画布内进行重绘.本文介绍canvas的图像处理 drawImage drawImage() 方法在画布上绘制图像.画布或视频.drawI ...
python Thread对象的setDaemon(True)的作用。
1.如果主线程是永远都不会结束的,那设置一个线程为守护线程是没必要的,设不设置都一样. 2.什么时候需要设置为守护线程?如果希望子线程一直运行,可以把子线程的代码写在while True里面一直循环, ...
IIS日志清理（VBS版,JS版）
IIS默认日志记录在C:\WINDOWS\system32\LogFiles,时间一长,特别是子站点多的服务器,一个稍微有流量的网站,其日志每天可以达到上百兆,这些文件日积月累会严重的占用服务器磁盘空 ...
Qt Creator build遇到error lnk1158 无法运行rc.exe
解决办法: 将C:\Program Files (x86)\Windows Kits\10\bin\10.0.15063.0\x64 目录下的rc.exe 和rcdll.dll 复制到 C:\Prog ...
AliRedis单机180w QPS, 8台服务器构建1000w QPS Cache集群
转自:http://www.open-open.com/lib/view/open1389880948758.html 引言: 如今redis凭借其高性能的优势, 以及丰富的数据结构作为 ...
用c语言如何在数字前自动补0
一: #include <stdio.h>int main(){ long a=3,b=4,c=15; printf("......."a,b,c);return 0; ...
在input中既隐藏边框，也隐藏轮廓的设置
在设置input的时候,我们往往不想显示边框,所以通常会在css里面写"border"none",但是结果往往差强人意,如下图我们这个时候可以加一个属性来把它的轮廓也隐 ...
secureCRT使用退格键（backspace）出现^H解决办法
解决办法步骤如下: 选项--->会话选项---> 把下面两个打个钩就行了. 原文地址:http://skykiss.blog.51cto.com/blog/2892603/769771 另 ...
【cs229-Lecture9】经验风险最小化
写在前面:机器学习的目标是从训练集中得到一个模型,使之能对测试集进行分类,这里,训练集和测试集都是分布D的样本.而我们会设定一个训练误差来表示测试集的拟合程度(训练误差),虽然训练误差具有一定的参考价 ...

转sklearn保存模型

创建模型

用pickle读写模型

用joblib进行模型的读写

转sklearn保存模型的更多相关文章

随机推荐

热门专题