数据归一化 scikit-learn中的Scaler

 1 import numpy as np

 2 from sklearn import datasets

 3

 4 # 获取数据

 5 iris = datasets.load_iris()

 6 X = iris.data

 7 y = iris.target

 8

 9 # 数据分割

10 from sklearn.model_selection import train_test_split

11 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=666)

12

13 # StandardScaler fit 训练集数据

14 from sklearn.preprocessing import StandardScaler

15 standardscaler = StandardScaler()

16 standardscaler.fit(X_train)

17

18 # 对训练集数据归一化

19 X_train = standardscaler.transform(X_train)

20

21 # 对测试集数据归一化

22 X_test_standard  = standardscaler.transform(X_test)

23

24 # 实例化分类器

25 from sklearn.neighbors import KNeighborsClassifier

26 knn_clf = KNeighborsClassifier(n_neighbors=3)

27

28 # 分类器 fit 归一化训练集

29 knn_clf.fit(X_train, y_train)

30

31 # 用归一化的测试集数据计算预测准确率

32 knn_clf.score(X_test_standard, y_test)

数据归一化 scikit-learn中的Scaler的更多相关文章

(原创)（四）机器学习笔记之Scikit Learn的Logistic回归初探
目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...
(原创)（三）机器学习笔记之Scikit Learn的线性回归模型初探
一.Scikit Learn中使用estimator三部曲 1. 构造estimator 2. 训练模型:fit 3. 利用模型进行预测:predict 二.模型评价模型训练好后,度量模型拟合效果的 ...
scikit learn 模块调参 pipeline+girdsearch 数据举例：文档分类（python代码）
scikit learn 模块调参 pipeline+girdsearch 数据举例:文档分类数据集 fetch_20newsgroups #-*- coding: UTF-8 -*- import ...
Scikit Learn: 在python中机器学习
转自:http://my.oschina.net/u/175377/blog/84420#OSC_h2_23 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的 ...
机器学习：数据归一化（Scaler）
数据归一化(Feature Scaling) 一.为什么要进行数据归一化原则:样本的所有特征,在特征空间中,对样本的距离产生的影响是同级的: 问题:特征数字化后,由于取值大小不同,造成特征空间中样本 ...
【笔记】scikit-learn中的Scaler（归一化）
scikit-learn中的数据归一化在机器学习使用数据归一化的时候有一个重要的注意事项我们对训练数据进行均值和方差的处理,得到mean_train以及std_train,但是在对测试数据进行归一 ...
第四十九篇入门机器学习——数据归一化（Feature Scaling）
No.1. 数据归一化的目的数据归一化的目的,就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用. No.2. 数据归一化的方法数据归一化的方法主要 ...
数据归一化Scaler-机器学习算法
//2019.08.03下午#机器学习算法的数据归一化(feature scaling)1.数据归一化的必要性:对于机器学习算法的基础训练数据,由于数据类型的不同,其单位及其量纲也是不一样的,而也正是 ...
数据处理：2.异常值处理 & 数据归一化 & 数据连续属性离散化
1.异常值分析异常值是指样本中的个别值,其数值明显偏离其余的观测值.异常值也称离群点,异常值的分析也称为离群点的分析. 异常值分析 → 3σ原则 / 箱型图分析异常值处理方法 → 删除 / 修正填补 ...
matlab将矩阵数据归一化到[0,255]
matlab将矩阵数据归一化到[0,255] function OutImg = Normalize(InImg) ymax=255;ymin=0; xmax = max(max(InImg) ...

随机推荐

Java——介绍
Java基础语法: 一个Java程序可以认为是一系列对象的集合,而这些对象通过彼此的方法来协同工作. 对象: 对象是类的一个实例,有状态和行为.例如,一条狗是一个对象,它的状态有:颜色.名字.品种:行 ...
深入理解java虚拟机，GC参考手册
深入理解java虚拟机一.<深入理解Java虚拟机> 1.第2章 Java内存区域与内存溢出异常 2.第3章垃圾收集器与内存分配策略 3.第4章虚拟机性能监控与故障处理工具 4.第5 ...
6.DHCP配置故障转移（Windows2012）
准备: 子网对应核心交换机网关配置多个中继 interface Vlan64 ip address 10.10.64.1 255.255.248.0 ip helper-address 10.10.1 ...
Codeforces Round #574 (Div. 2) E.OpenStreetMap
题目链接题目的意思就是给你一个矩阵你要求给定子矩阵的最小值的和单调队列扫两边即可 #include <bits/stdc++.h> #define ll long long #defi ...
Codeforces 1345 D - Monopole Magnets
传送门:D. Monopole Magnets 这一场也是很神奇了,先是推迟三天,后是评测鸡崩了,unrated... 题意:每一行,每一列必须都要至少有一个s,n要可以到所有的黑格,n的上下左右如果 ...
【bzoj 3333】排队计划（线段树）
n个数,求一次逆序对.接着有m次修改操作,把每次输入的位置p的数之后<=它的数取出来,从小到大排序后再放回空位里,求逆序对.(N,M<=500,000 , Ai<=10^9)思路:1 ...
hdu 6863 Isomorphic Strings 哈希+求公因子
题意: t组输入,每组数据输入一个整数n,代表字符串长度.下面再输入一个字符串你需要判断这个字符串能不能分成大于1段,且这些段的最小表示法是一样的例如:abccab,它可以分成2段,分别是abc和 ...
JavaScript——五
onload:在加载的时候因为网页代码是从上到下执行的,所以我们有些对网页内容的操作要先加载出网页内容后再执行script的内容,这个时候如果没有onload我们只能写在这些内容的后面,但是有了lo ...
JavaScript——三
任务: 其中的"options = options || {}"就代表如果options是一个真的对象,就使用它,否则就给他默认值在Node函数中: 函数中的this指向wind ...
Gym 2009-2010 ACM ICPC Southwestern European Regional Programming Contest (SWERC 2009) A. Trick or Treat (三分)
题意:在二维坐标轴上给你一堆点,在x轴上找一个点,使得该点到其他点的最大距离最小. 题解:随便找几个点画个图,不难发现,答案具有凹凸性,有极小值,所以我们直接三分来找即可. 代码: int n; lo ...

数据归一化 scikit-learn中的Scaler

数据归一化 scikit-learn中的Scaler的更多相关文章

随机推荐

热门专题