#调整随机森林的参数(调整max_features，结果未见明显差异)

#调整随机森林的参数(调整max_features，结果未见明显差异)

from sklearn import datasets

X, y = datasets.make_classification(n_samples=10000,n_features=20,n_informative=15,flip_y=.5, weights=[.2, .8])

import numpy as np

training = np.random.choice([True, False], p=[.8, .2],size=y.shape)

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier()

rf.fit(X[training], y[training])

preds = rf.predict(X[~training])

print ("Accuracy:\t", (preds == y[~training]).mean())

from sklearn.metrics import confusion_matrix

max_feature_params = ['auto', 'sqrt', 'log2', .01, .5, .99]

confusion_matrixes = {}

for max_feature in max_feature_params:

    rf = RandomForestClassifier(max_features=max_feature)

    rf.fit(X[training], y[training])

    print ("Accuracy:\t", (preds == y[~training]).mean())

    confusion_matrixes= confusion_matrix(y[~training],rf.predict(X[~training]))

    print(max_feature,confusion_matrixes)

    print('--------------------------------------------------------------------')

from sklearn.metrics import confusion_matrix

y_true = [2, 0, 2, 2, 0, 1]

y_pred = [0, 0, 2, 2, 0, 2]

print(confusion_matrix(y_true, y_pred))

y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]

y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]

print(confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"]))

'''

Accuracy:     0.640324214792

Accuracy:     0.640324214792

auto [[278 403]

 [306 987]]

--------------------------------------------------------------------

Accuracy:     0.640324214792

sqrt [[280 401]

 [324 969]]

--------------------------------------------------------------------

Accuracy:     0.640324214792

log2 [[304 377]

 [320 973]]

--------------------------------------------------------------------

Accuracy:     0.640324214792

0.01 [[285 396]

 [324 969]]

--------------------------------------------------------------------

Accuracy:     0.640324214792

0.5 [[289 392]

 [305 988]]

--------------------------------------------------------------------

Accuracy:     0.640324214792

0.99 [[294 387]

 [295 998]]

--------------------------------------------------------------------

[[2 0 0]

 [0 0 1]

 [1 0 2]]

[[2 0 0]

 [0 0 1]

 [1 0 2]]

'''

#调整随机森林的参数(调整max_features，结果未见明显差异)的更多相关文章

#调整随机森林的参数(调整n_estimators随机森林中树的数量默认10个树，精度递增显著，但并不是越多越好)，加上verbose=True，显示进程使用信息
#调整随机森林的参数(调整n_estimators随机森林中树的数量默认10个树,精度递增显著) from sklearn import datasets X, y = datasets.make_c ...
sklearn中随机森林的参数
一:sklearn中决策树的参数: 1,criterion: ”gini” or “entropy”(default=”gini”)是计算属性的gini(基尼不纯度)还是entropy(信息增益),来 ...
Sysctl命令及linux内核参数调整
一.Sysctl命令用来配置与显示在/proc/sys目录中的内核参数．如果想使参数长期保存,可以通过编辑/etc/sysctl.conf文件来实现. 命令格式: sysctl [-n ...
kaggle数据挖掘竞赛初步--Titanic<随机森林&特征重要性>
完整代码: https://github.com/cindycindyhi/kaggle-Titanic 特征工程系列: Titanic系列之原始数据分析和数据处理 Titanic系列之数据变换 Ti ...
随机森林入门攻略（内含R、Python代码）
随机森林入门攻略(内含R.Python代码) 简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获 ...
机器学习 —— 决策树及其集成算法(Bagging、随机森林、Boosting)
本文为senlie原创,转载请保留此地址:http://www.cnblogs.com/senlie/ 决策树--------------------------------------------- ...
R语言︱机器学习模型评估方案（以随机森林算法为例）
笔者寄语:本文中大多内容来自<数据挖掘之道>,本文为读书笔记.在刚刚接触机器学习的时候,觉得在监督学习之后,做一个混淆矩阵就已经足够,但是完整的机器学习解决方案并不会如此草率.需要完整的评 ...
大白话5分钟带你走进人工智能-第二十九节集成学习之随机森林随机方式，out of bag data及代码(2)
大白话5分钟带你走进人工智能-第二十九节集成学习之随机森林随机方式 ,out of bag data及代码(2) 上一节中我们讲解了随机森林的基本概念,本节的话我们讲解随机森 ...
机器学习：随机森林RF-OBB袋外错误率
文章讲解比较详细,且有Python代码,可以作为有用的参考. 原文链接:http://blog.csdn.net/zhufenglonglove/article/details/51785220 参 ...

随机推荐

用intellij idea 写第一个Java程序
Java小白,还不怎么会eclipse,只会在命令行用javac编译并java运行编译后的类. 英文还不好orz 发现创建项目后,能build但就是不能run... 找了半天教程没找着,去官网溜了一下 ...
hibernate学习（2）
1 实体类编写规则 2 hibernate主键生成策略 3实体类操作 (1)crud操作 (2)实体对象状态 4 hibernate的一级缓存 5 hibernate事务操作 (1)事务代码规则写法 ...
review06
使用关键字interface来定义一个接口.接口的定义和类定义很相似,分为接口声明和接口体. 接口体中包含常量的声明(没有变量)和抽象方法两部分.接口中只有抽象方法,没有普通方法.而且接口体中所有的常 ...
jQuery实现表格冻结行和列
前几天,遇到一个需求是要将表格的前几行和前几列冻结即固定,就是在有滚动条的情况下,保持那几行和那几列固定,这个需求其实是一个非常常见的需求,因为在涉及好多行和列时,在拖动滚动条时,我们需要知道每行每列 ...
django实现日期分类效果
日期分类效果图实现功能:能够按照月份进行分类,统计每个月份的文章数量,没有文章的月份不显示.点击每栏可以链接的当月的文章列表. 每月文章列表可以使用django的通用视图MonthArticleVi ...
解决：在Eclipse中运行monkeyrunner脚本报错: IOError: (2, 'File not found - D:\\workspace\\monkeyrunner_test01 (\u62d2\u7edd\u8bbf\u95ee\u3002)')
在eclipse中搭建运行monkeyrunner脚本的环境,请见lynnLi的博客monkeyrunner之eclipse中运行monkeyrunner脚本之环境搭建(四) 但在实践中,状况确实层出 ...
hdu 2149 Public Sale（bash）
Public Sale Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total ...
excel中日期设置星期
在设置日期格式中-自定义中-设置填入yyyy-mm-dd [$-804]aaa;@ 即可.
第六次scrum meeting记录
文章负责:刘斯盾日期:2017年10月30日会议地点:新主楼F座二楼各组员工作情况团队成员昨日完成任务明日要完成任务赵晓宇评分界面搭建 issue17 课程列表页面搭建 issue20 ...
HTTP协议与 Requests库
HTTP协议与 Requests库: 1 HTTP协议: 2 URL作为网络定位的标识: >>>> 用户通过url来定位资源 >>>> 然后通过 g ...

#调整随机森林的参数(调整max_features，结果未见明显差异)

#调整随机森林的参数(调整max_features，结果未见明显差异)的更多相关文章

随机推荐

热门专题