1. from sklearn.preprocessing import LabelEncoder
  2.  
  3. def gen_label_encoder():
  4. labels = ['BB', 'CC']
  5. le = LabelEncoder()
  6. le.fit(labels)
  7. print 'le.classes_', le.classes_
  8. for label in le.classes_:
  9. print label, le.transform([label])[0]
  10. joblib.dump(le, 'data/label_encoder.h5')

LabelEncoder的说明:

  1. class LabelEncoder(BaseEstimator, TransformerMixin):
  2. """Encode labels with value between 0 and n_classes-1.
  3.  
  4. Read more in the :ref:`User Guide <preprocessing_targets>`.
  5.  
  6. Attributes
  7. ----------
  8. classes_ : array of shape (n_class,)
  9. Holds the label for each class.
  10.  
  11. Examples
  12. --------
  13. `LabelEncoder` can be used to normalize labels.
  14.  
  15. >>> from sklearn import preprocessing
  16. >>> le = preprocessing.LabelEncoder()
  17. >>> le.fit([1, 2, 2, 6])
  18. LabelEncoder()
  19. >>> le.classes_
  20. array([1, 2, 6])
  21. >>> le.transform([1, 1, 2, 6]) #doctest: +ELLIPSIS
  22. array([0, 0, 1, 2]...)
  23. >>> le.inverse_transform([0, 0, 1, 2])
  24. array([1, 1, 2, 6])
  25.  
  26. It can also be used to transform non-numerical labels (as long as they are
  27. hashable and comparable) to numerical labels.
  28.  
  29. >>> le = preprocessing.LabelEncoder()
  30. >>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
  31. LabelEncoder()
  32. >>> list(le.classes_)
  33. ['amsterdam', 'paris', 'tokyo']
  34. >>> le.transform(["tokyo", "tokyo", "paris"]) #doctest: +ELLIPSIS
  35. array([2, 2, 1]...)
  36. >>> list(le.inverse_transform([2, 2, 1]))
  37. ['tokyo', 'tokyo', 'paris']
  38.  
  39. See also
  40. --------
  41. sklearn.preprocessing.OneHotEncoder : encode categorical integer features
  42. using a one-hot aka one-of-K scheme.
  43. """

利用sklearn的LabelEncoder对标签进行数字化编码的更多相关文章

  1. 机器学习入门-线性判别分析(LDA)1.LabelEncoder(进行标签的数字映射) 2.LinearDiscriminantAnalysis (sklearn的LDA模块)

    1.from sklearn.processing import LabelEncoder 进行标签的代码编译 首先需要通过model.fit 进行预编译,然后使用transform进行实际编译 2. ...

  2. 利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目(在这个过程中学习关于模型性能的评价指标,如accuracy,precision,recall,混淆矩阵)

    .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...

  3. 利用Sklearn实现加州房产价格预测,学习运用机器学习的整个流程(包含很多细节注解)

    Chapter1_housing_price_predict .caret, .dropup > .btn > .caret { border-top-color: #000 !impor ...

  4. 11.sklearn.preprocessing.LabelEncoder的作用

    In [5]: from sklearn import preprocessing ...: le =preprocessing.LabelEncoder() ...: le.fit(["p ...

  5. 利用sklearn计算文本相似性

    利用sklearn计算文本相似性,并将文本之间的相似度矩阵保存到文件当中.这里提取文本TF-IDF特征值进行文本的相似性计算. #!/usr/bin/python # -*- coding: utf- ...

  6. sklearn.preprocessing.LabelEncoder的使用

    在训练模型之前,我们通常都要对训练数据进行一定的处理.将类别编号就是一种常用的处理方法,比如把类别"男","女"编号为0和1.可以使用sklearn.prepr ...

  7. 利用localStorage事件来跨标签页共享sessionStorage

    //干货 利用localStorage事件来跨标签页共享sessionStorage //因为cookie保存字节数量有限,很多童鞋考虑用html5 storage来保存临时数据,Sessionsto ...

  8. 利用sklearn实现k-means

    基于上面的一篇博客k-means利用sklearn实现k-means #!/usr/bin/env python # coding: utf-8 # In[1]: import numpy as np ...

  9. 深度学习原理与框架-Tensorflow卷积神经网络-cifar10图片分类(代码) 1.tf.nn.lrn(局部响应归一化操作) 2.random.sample(在列表中随机选值) 3.tf.one_hot(对标签进行one_hot编码)

    1.tf.nn.lrn(pool_h1, 4, bias=1.0, alpha=0.001/9.0, beta=0.75) # 局部响应归一化,使用相同位置的前后的filter进行响应归一化操作 参数 ...

随机推荐

  1. Linux升级内核总结

    Linux内核升级总结. 一.编译内核步骤 1.#uname –r 确定系统的原内核版本,然后下载较新版本的Linux内核源码包 http://www.kernel.org/pub/linux/ker ...

  2. 爬虫之xpath

    什么是XML XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似 HTML XML 的设计宗旨是传输数据,而非显示数据 XML 的标签需要 ...

  3. springMVC入门案例

    1.配置文件的web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xs ...

  4. Asp.Net MVC 缓存设计

    Asp.Net MVC 缓存: 1. 可以直接在Controller,Action上面定义输出缓存OutputCache,如下,第一次请求这个Index的时候,里面的代码会执行,并且结果会被缓存起来, ...

  5. Vue——解决[Vue warn]: Invalid prop: custom validator check failed for prop "index". found in错误

    Invalid prop: custom validator check failed for prop "index". 错误重现: 使用element-ui的菜单,在SubMe ...

  6. init() 方法

    1 /** * servlet init()在web应用程序启动之后,第一个请求到达Servlet之前调用. * 问题1:如果init()中需要处理大量的工作,那么servlet在处理第一个请求需要花 ...

  7. MySQL Order By Rand()效率分析

    最近研究了一下MYSQL的随机抽取实现方法.举个例子,要从tablename表中随机提取一条记录,大家一般的写法就是:SELECT * FROM tablename ORDER BY RAND() L ...

  8. Python在线教程(廖雪峰)

    http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000

  9. LR 的基础分析--y-手打

    一.分析Analysis Summary 1.实际参与测试的Vuser为10个 2.总吞吐量(TPS)为208725625bytes 3.平均吞吐量为714814bytes/second 4.总点击数 ...

  10. hdu3706单调队列

    很基础的单调队列 #include<map> #include<set> #include<cmath> #include<queue> #includ ...