def datastandard():
from sklearn import preprocessing
import numpy as np
x = np.array([
[ 1., -1., 2.],
[ 2., 0., 0.],
[ 0., 1., -1.]])
print('原始数据为:\n',x) print('method1:指定均值方差数据标准化(默认均值0 方差 1):')
print('使用scale()函数 按列标准化')
x_scaled = preprocessing.scale(x)
print('标准化后矩阵为:\n',x_scaled,end='\n\n')
print('cur mean:', x_scaled.mean(axis=0), 'cur std:', x_scaled.std(axis=0)) print('使用scale()函数 按行标准化')
x_scaled = preprocessing.scale(x,axis=1)
print('标准化后矩阵为:\n',x_scaled,end='\n')
print('cur mean:', x_scaled.mean(axis=1), 'cur std:', x_scaled.std(axis=1)) print('\nmethod2:StandardScaler类,可以保存训练集中的参数')
scaler = preprocessing.StandardScaler().fit(x)
print('标准化前 均值方差为:',scaler.mean_,scaler.scale_)
print('标准化后矩阵为:\n',scaler.transform(x),end='\n\n') print('***2.数据归一化,映射到区间[min,max]:')
min_max_scaler = preprocessing.MinMaxScaler(feature_range=(0,10))
print(min_max_scaler.fit_transform(x)) if __name__ == '__main__':
datastandard()

结果如下:

原始数据为:
[[ 1. -1. 2.]
[ 2. 0. 0.]
[ 0. 1. -1.]]
method1:指定均值方差数据标准化(默认均值0 方差 1):
使用scale()函数 按列标准化
标准化后矩阵为:
[[ 0. -1.22474487 1.33630621]
[ 1.22474487 0. -0.26726124]
[-1.22474487 1.22474487 -1.06904497]]
cur mean: [ 0. 0. 0.] cur std: [ 1. 1. 1.] 使用scale()函数 按行标准化
标准化后矩阵为:
[[ 0.26726124 -1.33630621 1.06904497]
[ 1.41421356 -0.70710678 -0.70710678]
[ 0. 1.22474487 -1.22474487]]
cur mean: [ 1.48029737e-16 7.40148683e-17 0.00000000e+00] cur std: [ 1. 1. 1.] method2:StandardScaler类,可以保存训练集中的参数
标准化前 均值方差为: [ 1. 0. 0.33333333] [ 0.81649658 0.81649658 1.24721913]
标准化后矩阵为:
[[ 0. -1.22474487 1.33630621]
[ 1.22474487 0. -0.26726124]
[-1.22474487 1.22474487 -1.06904497]] ***2.数据归一化,映射到区间[min,max]:
[[ 5. 0. 10. ]
[ 10. 5. 3.33333333]
[ 0. 10. 0. ]]

python 常用代码

# coding:utf8
'''
提取文档中含有某个字符的所有行,并打印出来
'''
file_path = 'E:/gengyanpeng/义乌调研资料/客运gyp资料/keyun-bi.sql'
fix_str = 'FROM' def print_line(txt,fix_str):
lines = txt.split('\n')
for line in lines:
if fix_str in line:
print(line.strip()) with open(file_path,'r+',encoding='utf8') as f:
text = f.read() print_line(text,fix_str)

python数据标准化的更多相关文章

  1. python 数据标准化

  2. python数据分析数据标准化及离散化详解

    python数据分析数据标准化及离散化详解 本文为大家分享了python数据分析数据标准化及离散化的具体内容,供大家参考,具体内容如下 标准化 1.离差标准化 是对原始数据的线性变换,使结果映射到[0 ...

  3. 数据标准化方法及其Python代码实现

    数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间.目前数据标准化方法有多种,归结起来可以分为直线型方法(如极值法.标准差法).折线型方法(如三折线法).曲线型方法 ...

  4. 利用 pandas 进行数据的预处理——离散数据哑编码、连续数据标准化

    数据的标准化 数据标准化就是将不同取值范围的数据,在保留各自数据相对大小顺序不变的情况下,整体映射到一个固定的区间中.根据具体的实现方法不同,有的时候会映射到 [ 0 ,1 ],有时映射到 0 附近的 ...

  5. Python数据预处理:机器学习、人工智能通用技术(1)

    Python数据预处理:机器学习.人工智能通用技术 白宁超  2018年12月24日17:28:26 摘要:大数据技术与我们日常生活越来越紧密,要做大数据,首要解决数据问题.原始数据存在大量不完整.不 ...

  6. python data analysis | python数据预处理(基于scikit-learn模块)

    原文:http://www.jianshu.com/p/94516a58314d Dataset transformations| 数据转换 Combining estimators|组合学习器 Fe ...

  7. sklearn5_preprocessing数据标准化

    sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...

  8. 转:数据标准化/归一化normalization

    转自:数据标准化/归一化normalization 这里主要讲连续型特征归一化的常用方法.离散参考[数据预处理:独热编码(One-Hot Encoding)]. 基础知识参考: [均值.方差与协方差矩 ...

  9. sklearn.preprocessing.StandardScaler数据标准化

    原文链接:https://blog.csdn.net/weixin_39175124/article/details/79463993 数据在前处理的时候,经常会涉及到数据标准化.将现有的数据通过某种 ...

随机推荐

  1. oc48--多个对象内存管理练习

    // // main.m // 多个对象内存管理练习 // // ARC是Xcode帮我们生成内存释放的代码,MRC是需要我买自己写retain和release.想研究内存管理只能在MRC,管理对象就 ...

  2. Android中Calendar类的用法总结

    Calendar是Android开发中需要获取时间时必不可少的一个工具类,通过这个类可以获得的时间信息还是很丰富的,下面做一个总结,以后使用的时候就不用总是去翻书或者查资料了. 在获取时间之前要先获得 ...

  3. js中 if不判断解决方式

    $(function() { $("#number").blur(function() { var number = $('#number').val(); var num = $ ...

  4. ACM_一道耗时间的水题

    一道耗时间的水题 Time Limit: 2000/1000ms (Java/Others) Problem Description: Do you know how to read the phon ...

  5. C#之密封类(详解)

    10.3  密封类与密封方法 如果所有的类都可以被继承,那么很容易导致继承的滥用,进而使类的层次结构体系变得十分复杂,这样使得开发人员对类的理解和使用变得十分困难,为了避免滥用继承,C#中提出了密封类 ...

  6. 35个jquery小技巧

    1. 禁止右键点击 ? 1 2 3 4 5 $(document).ready(function(){     $(document).bind("contextmenu",fun ...

  7. C#将文件压缩成一个文件流,供前端下载

    直接上代码供大家参考... 前端页面就是一个下载的Button.. <body> <form id="form1" runat="server" ...

  8. (转载)实例详解Android快速开发工具类总结

    实例详解Android快速开发工具类总结 作者:LiJinlun 字体:[增加 减小] 类型:转载 时间:2016-01-24我要评论 这篇文章主要介绍了实例详解Android快速开发工具类总结的相关 ...

  9. 八:前端---Vue下的国际化处理

    1:首先安装 Vue-i8n npm install vue-i18n --save 注:-save-dev是指将包信息添加到devDependencies,表示你开发时依赖的包裹. -save是指将 ...

  10. 利用set特性判断list是否存在重复的值

    List<String>  list2=new ArrayList();//存放很多值的list //根据set不能存储相同的值该特性来判断list2中的值是否重复 HashSet set ...