sklearn 组合分类器

组合分类器：

组合分类器有4种方法：

(1)通过处理训练数据集。如baging boosting

(2)通过处理输入特征。如 Random forest

(3)通过处理类标号。error_correcting output coding

(4)通过处理学习算法。如voting

1 bagging

 from sklearn.ensemble import BaggingClassifier

 from sklearn.neighbors import KNeighborsClassifier

 meta_clf = KNeighborsClassifier()

 bg_clf = BaggingClassifier(meta_clf, max_samples=0.5, max_features=0.5)

2 adaboosting

 from sklearn.ensemble import AdaBoostClassifier

 bdt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=1),

                          algorithm="SAMME",

                          n_estimators=200)

 bdt.fit(X, y)

3 voting

 from sklearn import datasets

 from sklearn import cross_validation

 from sklearn.linear_model import LogisticRegression

 from sklearn.naive_bayes import GaussianNB

 from sklearn.ensemble import RandomForestClassifier

 from sklearn.ensemble import VotingClassifier

 iris = datasets.load_iris()

 X, y = iris.data[:, 1:3], iris.target

 clf1 = LogisticRegression(random_state=1)

 clf2 = RandomForestClassifier(random_state=1)

 clf3 = GaussianNB()

 eclf = VotingClassifier(estimators=[('lr', clf1), ('rf', clf2), ('gnb', clf3)], voting='hard', weights=[2,1,2])

 for clf, label in zip([clf1, clf2, clf3, eclf], ['Logistic Regression', 'Random Forest', 'naive Bayes', 'Ensemble']):

     scores = cross_validation.cross_val_score(clf, X, y, cv=5, scoring='accuracy')

     print("Accuracy: %0.2f (+/- %0.2f) [%s]" % (scores.mean(), scores.std(), label))

sklearn 组合分类器的更多相关文章

Dream team: Stacking for combining classifiers梦之队：组合分类器
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
基于sklearn的分类器实战
已迁移到我新博客,阅读体验更佳基于sklearn的分类器实战完整代码实现见github:click me 一.实验说明 1.1 任务描述 1.2 数据说明一共有十个数据集,数据集中的数据属性有全部 ...
sklearn常见分类器的效果比较
sklearn 是 python 下的机器学习库. scikit-learn的目的是作为一个“黑盒”来工作,即使用户不了解实现也能产生很好的结果. 其功能非常强大,当然也有很多不足的地方,就比如说神经 ...
sklearn各种分类器简单使用
sklearn中有很多经典分类器,使用非常简单:1.导入数据 2.导入模型 3.fit--->predict 下面的示例为在iris数据集上用各种分类器进行分类: #用各种方式在iris数据集上 ...
sklearn常见分类器(二分类模板)
# -*- coding: utf-8 -*- import pandas as pd import matplotlib matplotlib.rcParams['font.sans-serif'] ...
sklearn_随机森林random forest原理_乳腺癌分类器建模(推荐AAA)
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
【Keras案例学习】 sklearn包装器使用示范（mnist_sklearn_wrapper）
import numpy as np from keras.datasets import mnist from keras.models import Sequential from keras.l ...
sklearn简单实现机器学习算法记录
sklearn简单实现机器学习算法记录需要引入最重要的库:Scikit-learn 一.KNN算法 from sklearn import datasets from sklearn.model_s ...
SoftMax多分类器原理及代码理解
关于多分类我们常见的逻辑回归.SVM等常用于解决二分类问题,对于多分类问题,比如识别手写数字,它就需要10个分类,同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这里讨论另外一种方式 ...

随机推荐

IIS7.0+部署ARR负载均衡
安装: 1. 安装IIS(需要附带相关的健康检查,需要原始的那个默认站点) 2. 安装ARR相关的文件 3. 安装好之后,IIS里会出现有Server Farms的节点,直接创建服务器. 站点对 ...
zk 获取session，request，servletContext，response
(参考:http://www.dotblogs.com.tw/rockywang/archive/2010/01/13/12995.aspx) HttpServletRequest request = ...
android基础知识之一
1:Android系统架构(重点) 分层的架构 JNI java native interface 1.application :应用层 : java 2.application framework ...
git管理maven项目实现
1,在自己的git网新建一个项目.复制项目的地址. 2.在合适的目录执行 git clone命令,这样就把git的本地仓库建立好了. 3,java中 ,新建maven项目, 在location这里 ...
windows安装django
Window 下安装 Django 如果你还未安装Python环境需要先下载Python安装包. 1.Python 下载地址:https://www.python.org/downloads/ 2.D ...
【HDU3721】枚举+最长路
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3721 题意:给你一颗n个节点n-1条边的树,每条边都有一个权值,现在让你任意移动一条边然后把这条边连接 ...
div自定义的滚动条（水平导航条）
<!DOCTYPE html> <html> <head> <title></title> <style> div{ /* wi ...
如何在maven工程中加载oracle驱动
maven中引入oracle驱动报错Missing artifact com.oracle:ojdbc14:jar:10.2.0.4.0 时间:2015年09月22日浏览:9361次在maven ...
find a multiple
Description The input contains N natural (i.e. positive integer) numbers ( N <= 10000 ). Each of ...
true是表示使用身份验证,否则不使用身份验证
?phpclass smtp{/* Public Variables */var $smtp_port;var $time_out;var $host_name;var $log_file;var $ ...

sklearn 组合分类器

sklearn 组合分类器的更多相关文章

随机推荐

热门专题