sklearn官方学习资料
https://scikit-learn.org/stable/user_guide.html
1 Supervised learning监督学习
1.1 线性模型
1.2 线性模型和二次判别分析
1.3 核岭回归
1.4 SVM
1.5 随机梯度下降
1.6 最近邻
1.7 高斯过程
1.8 交叉分解cross decomposition
1.9 朴素贝叶斯
1.10 决策树
1.11 集成算法
1.12 多类别算法
1.13 特征选择
1.14 半监督
1.15 保序回归
1.16 probability calibration
1.17 神经网络

2 非监督学习
2.1 高斯混合模型
2.2 流型学习
2.3 聚类
2.4 双聚类
2.5 矩阵分解
2.6 协方差估计
2.7 异常点、离群点检测
2.8 密度估计
2.9 神经网络

3 模型选择和评估
3.1 交叉验证
3.2 调参
3.3 指标和评分
3.4 模型的持续性
3.5 验证曲线

4 检查inspection
4.1 依赖曲线
4.2 排序(置换)特征重要性

5 可视化

6 数据转化
6.1 管道
6.2 特征抽取
6.3 预处理数据
6.4 缺失值插补
6.5 非监督降维
6.6 随机投影
6.7 核近似
6.8 pairwise metrics,affinities and kernels
6.9 转化预测目标

7 数据集

6.3 preprocessing data数据预处理
https://scikit-learn.org/stable/modules/preprocessing.html#standardization-or-mean-removal-and-variance-scaling
归一化、正则化、标准化的区别
https://blog.csdn.net/tianguiyuyu/article/details/80694669
6.3.1 Standardization, or mean removal and variance scaling标准化(均值为0,方差为1)
preprocessing.scale
preprocessing.StandardScaler 在训练样本上使用后,可以同时应用到测试样本
6.3.1.1. Scaling features to a range
preprocessing.MinMaxScaler 把数据标准化到指定的最大值最小值之间
preprocessing.MaxAbsScaler 把数据标准化到指定的最大的绝对值之间
6.3.1.2. Scaling sparse data
preprocessing.MaxAbsScaler(要用transform API)
preprocessing.maxabs_scale
6.3.1.3. Scaling data with outliers
robust_scale
RobustScaler(要用transform API)
6.3.1.4. Centering kernel matrices
KernalCenterer
6.3.2. Non-linear transformation 非线性转化
6.3.2.1. Mapping to a Uniform distribution
QuantileTransformer
quantile_transform
6.3.2.2. Mapping to a Gaussian distribution
PowerTransformer
6.3.3. Normalization 归一化
Normalization is the process of scaling individual samples to have unit norm.
normalize
Normalizer(要用transform API)
6.3.4. Encoding categorical features
OrdinalEncoder(顺序编码)
OneHotEncoder
6.3.5. Discretization离散化
For instance, pre-processing with a discretizer can introduce nonlinearity to linear models.
6.3.5.1. K-bins discretization
The ‘uniform’ strategy uses constant-width bins. The ‘quantile’ strategy uses the quantiles values to have equally populated bins in each feature. The ‘kmeans’ strategy defines bins based on a k-means clustering procedure performed on each feature independently.
6.3.5.2. Feature binarization(二值化)
preprocessing.Binarizer(threshold=1.1)
6.3.6. Imputation of missing values
6.3.7. Generating polynomial features
from sklearn.preprocessing import PolynomialFeatures
PolynomialFeatures(degree=3, interaction_only=True)
6.3.8. Custom transformers(定制化转化)
convert an existing Python function into a transformer to assist in data cleaning or processing

sklearn包的更多相关文章

  1. sklearn包中有哪些数据集你都知道吗?

    注册了博客园一晃有3个月了,同时接触机器学习也断断续续的算是有1个月了.今天就用机器学习神器sklearn包的相关内容作为我的开篇文章吧. 本文将对sklearn包中的数据集做一个系统介绍,并简单说一 ...

  2. Python: 安装 sklearn 包出现错误的解决方法

    今天在安装 Python 的 sklearn 包时出现了 Cannot uninstall 'numpy' 和 Cannot uninstall 'scipy' 错误,下面记录了我尝试了很多网上的方法 ...

  3. sklearn包源码分析(二)——ensemble(未完成)

    网络资源 sklearn包tree模型importance解析

  4. sklearn包学习

    1首先是sklearn的官网:http://scikit-learn.org/stable/ 在官网网址上可以看到很多的demo,下边这张是一张非常有用的流程图,在这个流程图中,可以根据数据集的特征, ...

  5. 调用sklearn包中的PLA算法[转载]

    转自:https://blog.csdn.net/u010626937/article/details/72896144#commentBox 1.Python的机器学习包sklearn中也包含了感知 ...

  6. sklearn包源码分析(一)--neighbors

    python如何查看内置函数的用法及其源码? 在anaconda的安装目录下,有一块会放着我们安装的所有包,在里面可以找到所有的包 找到scikit learn包,进入 这里面又有了多个子包,每个子包 ...

  7. python matplotlib绘图/sklearn包--make_blobs()

    1.make_bolbs() 函数 from sklearn.datasets.samples_generator import make_blobs import numpy as np impor ...

  8. 安装Python的机器学习包Sklearn 出错解决方法

    1 首先须要安装Cython.网上下载后进行本地安装 python setup.py install 2 下载Sklearn包,https://pypi.python.org/pypi/scikit- ...

  9. 机器学习之sklearn——SVM

    sklearn包对于SVM可输出支持向量,以及其系数和数目: print '支持向量的数目: ', clf.n_support_ print '支持向量的系数: ', clf.dual_coef_ p ...

随机推荐

  1. java向python ,text文件动态传参或传值问题完美解决

    由于业务需要对python文件进行参数传递,通过下面两个java方法完美解决此问题,我的思路是:首先我要先把上次写的参数删除,第二我要新的参数写到python文件中. 第一个方法解决了删除上次传递的参 ...

  2. 10 Json(unity3D)

    //写入json文档注意事项: 1.在Asset下要有一个StreamingAssets文件夹 2.在文件夹内,有一个已创建好的json空文档 3.引入命名空间 using Litjson; usin ...

  3. 吴裕雄--天生自然JAVA SPRING框架开发学习笔记:Spring Bean的生命周期

    Spring 容器可以管理 singleton 作用域 Bean 的生命周期,在此作用域下,Spring 能够精确地知道该 Bean 何时被创建,何时初始化完成,以及何时被销毁. 而对于 protot ...

  4. 关于mybatis的<selectKey>中的keyColumn

    <mapper namespace="com.dao.EmployeeDao"> <insert id="insert"> <se ...

  5. 使用connected-react-router使router与store同步

    connected-react-router是一个绑定react-router到redux的组件,来实现双向绑定router的数据到redux store中,这么做的好处就是让应用更Redux化,可以 ...

  6. .NET技术-2.0. 操作数据库-Dapper

    .NET技术-2.0. 操作数据库-Dapper 项目参见: 1. 为什么选择Dapper 1) 性能优越: 其实在各大网站上,我们大概都会看到这样的一个对比效果图,在超过500次poco seria ...

  7. 经典线段树 UVALive 3938/UVA 1400

    题意:就是相当于动规里面的求最大连续子串,不同的是,这里需要读入一个区间x,y,输出的区间 a,b 且x<=a<=b<=y,使得a b的连续子串最长,而且询问次数达到了10的五次方. ...

  8. dp高难本攻略

    903. DI 序列的有效排列 public int numPermsDISequence(String S) { int n=S.length(); int [][]dp=new int [n+1] ...

  9. shell中获取文件目录方法

    1.``:表示执行对应的命令,嵌套时使用`\`\``,注意\进行转义,同时执行多个命令时使用:隔开file=`cd "\`dirname $0\`";pwd`echo $file ...

  10. 增删改查(简单版&连接数据库)

    这个博客也是补充之前的学习内容: 项目总述:这个增删改查我以,选课名称,选课教室,选课教师基本信息,作为主要的信息来源.主要对这些信息最基本的增删改查 详细的分析与说明: 1.首先在src文件里定义四 ...