sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做

Having said that, you can query sklearn.preprocessing.StandardScaler for the fit parameters:

scale_ : ndarray, shape (n_features,) Per feature relative scaling of the data. New in version 0.17: scale_ is recommended instead of deprecated std_. mean_ : array of floats with shape [n_features] The mean value for each feature in the training set.

The following short snippet illustrates this:

from sklearn import preprocessing

import numpy as np

s = preprocessing.StandardScaler()

s.fit(np.array([[1., 2, 3, 4]]).T)

>>> s.mean_, s.scale_

(array([ 2.5]), array([ 1.11803399]))

参考：https://stackoverflow.com/questions/35944783/how-to-store-scaling-parameters-for-later-use

解法：

>>> from sklearn import preprocessing

>>> import numpy as np

>>>

>>> s = preprocessing.StandardScaler()

>>> s.fit(np.array([[1., 2, 3, 4]]).T)

StandardScaler(copy=True, with_mean=True, with_std=True)

>>> s.mean_, s.scale_

(array([2.5]), array([1.11803399]))

>>> s.transform(np.array([[1., 2, 3, 4]]).T)

array([[-1.34164079],

       [-0.4472136 ],

       [ 0.4472136 ],

       [ 1.34164079]])

>>> (1-s.mean_)/s.scale_

array([-1.34164079])

>>> a=np.array([1,2,3])

>>> b=np.array([1,2,3])

>>> a==b

array([ True,  True,  True])

(np.array([1., 2, 3, 4])-s.mean_)/s.scale_
array([-1.34164079, -0.4472136 , 0.4472136 , 1.34164079]) 和transform效果一样。

可以看到，离线使用StandardScaler时，只需要s.mean_, s.scale_这两个关键参数即可！

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做的更多相关文章

sklearn.preprocessing.StandardScaler数据标准化
原文链接:https://blog.csdn.net/weixin_39175124/article/details/79463993 数据在前处理的时候,经常会涉及到数据标准化.将现有的数据通过某种 ...
Python数据预处理(sklearn.preprocessing)—归一化(MinMaxScaler)，标准化(StandardScaler)，正则化(Normalizer, normalize)
关于数据预处理的几个概念归一化 (Normalization): 属性缩放到一个指定的最大和最小值(通常是1-0)之间,这可以通过preprocessing.MinMaxScaler类实现. 常 ...
数据规范化——sklearn.preprocessing
sklearn实现---归类为5大类 sklearn.preprocessing.scale()(最常用,易受异常值影响) sklearn.preprocessing.StandardScaler() ...
sklearn preprocessing （预处理）
预处理的几种方法:标准化.数据最大最小缩放处理.正则化.特征二值化和数据缺失值处理. 知识回顾: p-范数:先算绝对值的p次方,再求和,再开p次方. 数据标准化:尽量将数据转化为均值为0,方差为1的数 ...
【sklearn】数据预处理 sklearn.preprocessing
数据预处理标准化 (Standardization) 规范化(Normalization) 二值化分类特征编码推定缺失数据生成多项式特征定制转换器 1. 标准化Standardization ...
sklearn学习笔记（一）——数据预处理 sklearn.preprocessing
https://blog.csdn.net/zhangyang10d/article/details/53418227 数据预处理 sklearn.preprocessing 标准化 (Standar ...
The sklearn preprocessing
Recently, I was writing module of feature engineering, i found two excellently packages -- tsfresh a ...
sklearn.preprocessing.LabelBinarizer
sklearn.preprocessing.LabelBinarizer
sklearn.preprocessing.LabelEncoder的使用
在训练模型之前,我们通常都要对训练数据进行一定的处理.将类别编号就是一种常用的处理方法,比如把类别"男","女"编号为0和1.可以使用sklearn.prepr ...

随机推荐

Python3.6全栈开发实例[003]
3.检查传入列表的长度,如果大于2,将列表的前两项内容返回给调用者. li = [11,22,33,44,55,66,77,88,99,000,111,222] def func3(lst): if ...
pycharm中导入自写模块时，模块下出现红线
问题描述: 在pycharm中导入自己写的模块时,得不到智能提示,并在模块名下出现下红线,但是代码可以执行,错误提示为下图所示: 原因:出现以上情况,是因为文件目录设置的问题,pycharm中的最上 ...
Linux用户相关文件之密码文件
1.文件地址: /etc/shadow ----------. 1 root root 842 10月 6 13:09 /etc/shadow 2.文件内容: xiaol_1:$6$NdCAnK3y$ ...
eval in Shell
语法:eval cmdLine eval会对后面的cmdLine进行两遍扫描,如果第一遍扫描后,cmdLine是个普通命令,则执行此命令: 如果cmdLine中含有变量的间接引用,则保证间接引用的语义 ...
python数据之间的转换和关系
首先数据类型在我看来分为两类: 容器类:能存储数据,例如:元祖.列表.集合.字符串. 原子类:单纯保存数值,例如:整数.浮点数.复数. 容器类与容器类之间,一般都可以进行两两之间的转化. 原子类与原子 ...
Python基础（8）_迭代器、生成器、列表解析
一.迭代器 1.什么是迭代 1 重复 2 下次重复一定是基于上一次的结果而来 l=[,,,] count= while count < len(l): print(l[count]) count ...
VMware虚拟机NAT模式的具体配置
NAT模式的具体配置 NAT方式:虚拟机可以上外网,可以访问宿主计算机所在网络的其他计算机(反之不行). 1.1.1. 查看虚拟机的网络参数 1) 打开虚拟机,选择菜单&q ...
python3 multiprocessing 模块
多进程 Multiprocessing 模块 multiprocessing 模块官方说明文档 Process 类 Process 类用来描述一个进程对象.创建子进程的时候,只需要传入一个执行函数和函 ...
Kattis - convexpolygonarea 【数学】
题意给出一系列点,求这个多边形面积思路向量叉积 AC代码 #include <cstdio> #include <cstring> #include <ctype. ...
octotree神器 For Github and GitLab 火狐插件
Code tree for GitHub and GitLabExtension to show code tree for GitHub and GitLab. Useful for develop ...

sklearn.preprocessing.StandardScaler 离线使用 不使用pickle如何做

sklearn.preprocessing.StandardScaler 离线使用 不使用pickle如何做的更多相关文章

随机推荐

热门专题

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做的更多相关文章