sklearn学习4----预处理（1）标准化

一、【标准化】scale：

1、导入模块 from sklearn.preprocessing import scaler

2、作用：直接将给定数据进行标准化

3、使用代码

X_scaled=scaler(X_data)
X_scaled.mean(axis=0)  #自己计算标准化之后的均值
X_scalerd.std(axis=0)  #自己计算标准化后的方差

二、【标准化】StandardScaler

1、导入模块 from sklearn.preprocessing import StandardScaler

2、作用：可保存训练集中的均值、方差参数，然后直接用于转换测试集数据。

3、使用代码：

ss=StandardScaler()

Xtrain_data=ss.fit_transform(train_data)  #标准化训练集然后保存训练集的均值和方差
Xtest_data=ss.transform(test_data)      #转换测试集数据

print(ss.mean_)

print(ss.var_)

三、【缩放到指定范围（最大最小化）】MinMaxScaler

1、导入模块：from sklearn.preprocessing import MinMaxScaler

2、作用：将属性缩放到一个指定的最大和最小值（通常是1-0）之间，这样处理可对方差非常小的属性增强其稳定性，也可维持稀疏矩阵中为0的条目。

3、使用代码

'''

preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True) 

计算公式：

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))

X_scaled = X_std * (max - min) + min

其中

feature_range : tuple (min, max), default=(0, 1)

'''

minmaxscaler = MinMaxScaler()

minmaxscaler.fit_transform(X)

minmaxscaler.scale_

minmaxscaler.min_

四、【正则化】 Normalizer

1、导入模块：from sklearn.preprocessing import Normalizer

2、作用：对每个样本计算其p-范数，再对每个元素除以该范数，这使得每个处理后样本的p-范数（l1-norm,l2-norm）等于1。如果后续要使用二次型等方法计算两个样本之间的相似性会有用。

3、使用代码

normalizer =Normalizer().fit(X)

normalizer.transform(X)

sklearn学习4----预处理（1）标准化的更多相关文章

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一.标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行. 将数据按期属性(按列进行)减去其均值,并处以其方差.得到的结果是,对于每个属 ...
【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一.标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行. 将数据按期属性(按列进行)减去其均值,并处以其方差.得到的结果是,对于每个属 ...
使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一.标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行. 将数据按期属性(按列进行)减去其均值,并除以其方差.得到的结果是,对于每个属 ...
【Sklearn系列】使用Sklearn进行数据预处理
这篇文章主要讲解使用Sklearn进行数据预处理,我们使用Kaggle中泰坦尼克号事件的数据作为样本. 读取数据并创建数据表格,查看数据相关信息 import pandas as pd import ...
Python: sklearn库——数据预处理
Python: sklearn库 —— 数据预处理数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化. 原因:数据集的标准化(服从均值为 ...
sklearn学习_01
# -*- coding: utf-8 -*- """ Created on Fri Sep 29 11:05:52 2017 机器学习之sklearn @author: ...
CNN学习笔记：批标准化
CNN学习笔记:批标准化 Batch Normalization Batch Normalization, 批标准化, 是将分散的数据统一的一种做法, 也是优化神经网络的一种方法. 在神经网络的训练过 ...
sklearn学习笔记（一）——数据预处理 sklearn.preprocessing
https://blog.csdn.net/zhangyang10d/article/details/53418227 数据预处理 sklearn.preprocessing 标准化 (Standar ...
Python数据预处理(sklearn.preprocessing)—归一化(MinMaxScaler)，标准化(StandardScaler)，正则化(Normalizer, normalize)
关于数据预处理的几个概念归一化 (Normalization): 属性缩放到一个指定的最大和最小值(通常是1-0)之间,这可以通过preprocessing.MinMaxScaler类实现. 常 ...
sklearn中的数据预处理----good!! 标准化归一化在何时使用
RESCALING attribute data to values to scale the range in [0, 1] or [−1, 1] is useful for the optimiz ...

随机推荐

死磕itchat源码--__init__.py
itchat包中的__init__.py是该库的入口:在该文件中的源码如下: # -*- coding: utf-8 -*- from . import content from .core impo ...
ACM成长之路
前几天在网上看到,转过来时刻督促一下自己. ACM队不是为了一场比赛而存在的,为的是队员的整体提高. 大学期间,ACM队队员必须要学好的课程有: l C/C++两种语言 l 高等数学 l 线性代数 l ...
【LibreOJ 6277】数列分块入门 1 （分块）
emmm-学下分块~ 区间:数列中连续一段的元素区间操作:将某个区间[a,b]的所有元素进行某种改动的操作块:我们将数列划分成若干个不相交的区间,每个区间称为一个块整块:在一个区间操作时,完整包 ...
[洛谷 P2365] 任务安排（线性dp）
3月14日第二题!! 题目描述 N个任务排成一个序列在一台机器上等待完成(顺序不得改变),这N个任务被分成若干批,每批包含相邻的若干任务.从时刻0开始,这些任务被分批加工,第i个任务单独完成所需的时间 ...
python初学者学习笔记
python开发: a.Python基础 b.网络编程 c.web框架 —用于写网站 d.设计阶段+算法 e.项目阶段开发: 开发语言:高级语言:python/Java/PHP/C#/Go/ruby ...
CentOS 安装 VMTools
1.点击虚拟机,选择安装 VMware Tools 2.把压缩包复制到桌面 3.给当前用户管理员权限,然后解压该压缩包 4.进入到解压后的文件夹 5.执行 vmware-install.pl 6 ...
iis配置问题报错 -- Could not load file or assembly 'Oracle.DataAccess' or one of its dependencies
具体提示: Could not load file or assembly 'Oracle.DataAccess' or one of its dependencies. 试图加载格式不正确的程序. ...
【LeetCode-面试算法经典-Java实现】【033-Search in Rotated Sorted Array（在旋转数组中搜索）】
[033-Search in Rotated Sorted Array(在旋转数组中搜索)] [LeetCode-面试算法经典-Java实现][全部题目文件夹索引] 原题 Suppose a sort ...
[Android]RecyclerView的简单演示样例
去年google的IO上就展示了一个新的ListView.它就是RecyclerView. 下面是官方的说明,我英语能力有限,只是我大概这么理解:RecyclerView会比ListView更具有拓展 ...
ZooKeeper分布式集群部署及问题
ZooKeeper为分布式应用系统提供了高性能服务,在许多常见的集群服务中被广泛使用,最常见的当属HBase集群了,其他的还有Solr集群.Hadoop-2中的HA自己主动故障转移等. 本文主要介绍了 ...

sklearn学习4----预处理（1）标准化

一、【标准化】scale：

二、【标准化】StandardScaler

三、【缩放到指定范围（最大最小化）】MinMaxScaler

四、【正则化】 Normalizer

sklearn学习4----预处理（1）标准化的更多相关文章

随机推荐

热门专题