利用sklearn的LabelEncoder对标签进行数字化编码

from sklearn.preprocessing import LabelEncoder

def gen_label_encoder():

    labels = ['BB', 'CC']

    le = LabelEncoder()

    le.fit(labels)

    print 'le.classes_', le.classes_

    for label in le.classes_:

        print label, le.transform([label])[0]

    joblib.dump(le, 'data/label_encoder.h5')

LabelEncoder的说明：

 class LabelEncoder(BaseEstimator, TransformerMixin):

     """Encode labels with value between 0 and n_classes-1.

     Read more in the :ref:`User Guide <preprocessing_targets>`.

     Attributes

     ----------

     classes_ : array of shape (n_class,)

         Holds the label for each class.

     Examples

     --------

     `LabelEncoder` can be used to normalize labels.

     >>> from sklearn import preprocessing

     >>> le = preprocessing.LabelEncoder()

     >>> le.fit([1, 2, 2, 6])

     LabelEncoder()

     >>> le.classes_

     array([1, 2, 6])

     >>> le.transform([1, 1, 2, 6]) #doctest: +ELLIPSIS

     array([0, 0, 1, 2]...)

     >>> le.inverse_transform([0, 0, 1, 2])

     array([1, 1, 2, 6])

     It can also be used to transform non-numerical labels (as long as they are

     hashable and comparable) to numerical labels.

     >>> le = preprocessing.LabelEncoder()

     >>> le.fit(["paris", "paris", "tokyo", "amsterdam"])

     LabelEncoder()

     >>> list(le.classes_)

     ['amsterdam', 'paris', 'tokyo']

     >>> le.transform(["tokyo", "tokyo", "paris"]) #doctest: +ELLIPSIS

     array([2, 2, 1]...)

     >>> list(le.inverse_transform([2, 2, 1]))

     ['tokyo', 'tokyo', 'paris']

     See also

     --------

     sklearn.preprocessing.OneHotEncoder : encode categorical integer features

         using a one-hot aka one-of-K scheme.

     """

利用sklearn的LabelEncoder对标签进行数字化编码的更多相关文章

机器学习入门-线性判别分析（LDA）1.LabelEncoder(进行标签的数字映射) 2.LinearDiscriminantAnalysis (sklearn的LDA模块)
1.from sklearn.processing import LabelEncoder 进行标签的代码编译首先需要通过model.fit 进行预编译,然后使用transform进行实际编译 2. ...
利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目（在这个过程中学习关于模型性能的评价指标，如accuracy，precision，recall，混淆矩阵）
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
利用Sklearn实现加州房产价格预测,学习运用机器学习的整个流程（包含很多细节注解）
Chapter1_housing_price_predict .caret, .dropup > .btn > .caret { border-top-color: #000 !impor ...
11.sklearn.preprocessing.LabelEncoder的作用
In [5]: from sklearn import preprocessing ...: le =preprocessing.LabelEncoder() ...: le.fit(["p ...
利用sklearn计算文本相似性
利用sklearn计算文本相似性,并将文本之间的相似度矩阵保存到文件当中.这里提取文本TF-IDF特征值进行文本的相似性计算. #!/usr/bin/python # -*- coding: utf- ...
sklearn.preprocessing.LabelEncoder的使用
在训练模型之前,我们通常都要对训练数据进行一定的处理.将类别编号就是一种常用的处理方法,比如把类别"男","女"编号为0和1.可以使用sklearn.prepr ...
利用localStorage事件来跨标签页共享sessionStorage
//干货利用localStorage事件来跨标签页共享sessionStorage //因为cookie保存字节数量有限,很多童鞋考虑用html5 storage来保存临时数据,Sessionsto ...
利用sklearn实现k-means
基于上面的一篇博客k-means利用sklearn实现k-means #!/usr/bin/env python # coding: utf-8 # In[1]: import numpy as np ...
深度学习原理与框架-Tensorflow卷积神经网络-cifar10图片分类(代码) 1.tf.nn.lrn(局部响应归一化操作) 2.random.sample(在列表中随机选值) 3.tf.one_hot(对标签进行one_hot编码)
1.tf.nn.lrn(pool_h1, 4, bias=1.0, alpha=0.001/9.0, beta=0.75) # 局部响应归一化,使用相同位置的前后的filter进行响应归一化操作参数 ...

随机推荐

MysQL使用一与Python交互
与python交互在熟练使用sql语句的基础上,开始使用python语言提供的模块与mysql进行交互这是我们在工作中大事要做的事先学会sql是基础,一定要熟练编写sql语句安装引入模块安装 ...
go语言中strings包中的Trim函数的作用是什么
答:Trim函数原型如下: func Trim(s string, cutset string) string 去掉字符串s中首部以及尾部与字符串cutset中每个相匹配的字符,如: s=" ...
实现ModelDriver接口的功能(转）
ModelDriver接口来自com.opensymphony.xwork2.ModelDriven.是xwork-2.1.2-750.jar包的东西. 下面是源码: package com.ope ...
mybatis映射文件_select_resultMap
实体类: Employee.java类: package com.hand.mybatis.bean; public class Employee { private Integer e ...
ConcurrentHashMap实现线程安全的原理
并发环境下为什么使用ConcurrentHashMap 1. HashMap在高并发的环境下,执行put操作会导致HashMap的Entry链表形成环形数据结构,从而导致Entry的next节点始终不 ...
.net 下的 HttpRuntime.Cache 应用
using System;using System.Collections.Generic;using System.Diagnostics;using System.Linq;using Syste ...
kubernetes源码分析 -- kube-proxy
Kube-proxy需要在每一个minion结点上运行.他的作用是service的代理,负责将业务连接到service后面具体执行结点(endpoints). 我们列一下体现kube-proxy ...
KVM irqfd and ioeventfd
In previous article vhost architecture we mentioned that vhost and the guest signal each other by ir ...
redis——redis主从复制
和MySQL主从复制的原因一样,Redis虽然读取写入的速度都特别快,但是也会产生读压力特别大的情况.为了分担读压力,Redis支持主从复制,Redis的主从结构可以采用一主多从或者级联结构,Redi ...
英语每日阅读---4、VOA慢速英语(翻译+字幕+讲解):专家:城市发展将加剧住房危机
英语每日阅读---4.VOA慢速英语(翻译+字幕+讲解):专家:城市发展将加剧住房危机一.总结一句话总结:城市化(越来越多的人会住进城市)是必然趋势,人口增长也是必然趋势,人口增长必然会加大住房危 ...

利用sklearn的LabelEncoder对标签进行数字化编码

利用sklearn的LabelEncoder对标签进行数字化编码的更多相关文章

随机推荐

热门专题