Python随机森林算法的使用

#coding:utf-8

# from python.Lib.packages.sklearn.tree import DecisionTreeClassifier

# from python.Lib.packages.matplotlib.pyplot import *

# from python.Lib.packages.sklearn.cross_validation import train_test_split

# from python.Lib.packages.sklearn.ensemble import RandomForestClassifier

# from python.Lib.packages.sklearn.externals.joblib import Parallel,delayed

# from python.Lib.packages.sklearn.tree import export_graphviz

# from python.Lib.packages.sklearn.datasets import load_iris

# import python.Lib.packages.pandas as pd

from sklearn.tree import DecisionTreeClassifier

from matplotlib.pyplot import *

from sklearn.cross_validation import train_test_split

from sklearn.ensemble import RandomForestClassifier

from sklearn.externals.joblib import Parallel,delayed

from sklearn.tree import export_graphviz

from sklearn.datasets import load_iris

import pandas as pd

def RandomForest(dir):

    # final = open('F:/test/final.dat' , 'r')

    data=pd.read_csv(dir)

    # data = [line.strip().split('\t') for line in final]

    feature=data[[i for i in range(8)]].values

    target=data[[8]].values

    # target1=[target[0][i] for i in range(len(target[0]))]

    # print feature

    # print target

    # feature = [[float(x) for x in row[3:]] for row in data]

    # target = [int(row[0]) for row in data]

    #拆分训练集和测试集

    # iris=load_iris()

    #

    # feature=iris.data

    # target=iris.target

    # print iris['target'].shape

    feature_train, feature_test, target_train, target_test = train_test_split(feature, target, test_size=0.1, random_state=42)

    #分类型决策树

    clf = RandomForestClassifier()

    #训练模型

    s = clf.fit(feature_train,target_train)

    print s

    #评估模型准确率

    r = clf.score(feature_test , target_test)

    print r

    print u'判定结果：%s' % clf.predict(feature_test[0])

    #print clf.predict_proba(feature_test[0])

    print u'所有的树:%s' % clf.estimators_

    print clf.classes_

    print clf.n_classes_

    print u'各feature的重要性：%s' % clf.feature_importances_

if __name__=="__main__":

    dir="Carseats.csv"

    RandomForest(dir)

Python随机森林算法的使用的更多相关文章

H2O中的随机森林算法介绍及其项目实战（python实现）
H2O中的随机森林算法介绍及其项目实战(python实现) 包的引入:from h2o.estimators.random_forest import H2ORandomForestEstimator ...
用Python实现随机森林算法，深度学习
用Python实现随机森林算法,深度学习拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩 ...
Python机器学习笔记——随机森林算法
随机森林算法的理论知识随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为“代 ...
随机森林算法demo python spark
关键参数最重要的,常常需要调试以提高算法效果的有两个参数:numTrees,maxDepth. numTrees(决策树的个数):增加决策树的个数会降低预测结果的方差,这样在测试时会有更高的accu ...
随机森林算法OOB_SCORE最佳特征选择
RandomForest算法(有监督学习),可以根据输入数据,选择最佳特征组合,减少特征冗余:原理:由于随机决策树生成过程采用的Boostrap,所以在一棵树的生成过程并不会使用所有的样本,未使用的样 ...
Spark mllib 随机森林算法的简单应用（附代码）
此前用自己实现的随机森林算法,应用在titanic生还者预测的数据集上.事实上,有很多开源的算法包供我们使用.无论是本地的机器学习算法包sklearn 还是分布式的spark mllib,都是非常不错 ...
Bagging与随机森林算法原理小结
在集成学习原理小结中,我们讲到了集成学习有两个流派,一个是boosting派系,它的特点是各个弱学习器之间有依赖关系.另一种是bagging流派,它的特点是各个弱学习器之间没有依赖关系,可以并行拟合. ...
R语言︱决策树族——随机森林算法
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:有一篇<有监督学习选择深度学习 ...
R语言︱机器学习模型评估方案（以随机森林算法为例）
笔者寄语:本文中大多内容来自<数据挖掘之道>,本文为读书笔记.在刚刚接触机器学习的时候,觉得在监督学习之后,做一个混淆矩阵就已经足够,但是完整的机器学习解决方案并不会如此草率.需要完整的评 ...

随机推荐

UVa 679 小球下落
题意:这道题规律性极强,虽然是二叉树,但是可以用模拟来写. 1<<20 意思是1的二进制左移20位,即2的20次方. 对于二叉树中一个节点 k ,其左节点,右节点的编号分别是2k 和 2k ...
[原创]cocos2d-x研习录-第二阶概念类之场景类(CCScene)
场景类CCScene是Cocos2D-x在屏幕显示的内容,相当于游戏关卡或界面.CCDirector任何时候只能显示一个场景CCScene,游戏中可能存在若干场景,CCDirector通过场景切换达到 ...
JavaScript 中的window.event代表的是事件的状态,jquery事件对象属性,jquery中如何使用event.target
http://wenda.haosou.com/q/1373868839069215 http://kylines.iteye.com/blog/1660236 http://www.cnblogs. ...
029. aps.net中DataView中详细信息的跳转显示
点击当前页面的连接, 跳转到另一个页面, 然后进行更新删除等一系列操作主要代码: <%@ Page Language="C#" AutoEventWireup=" ...
Windows 10的TPM模块到底是不是美国全球监控体系的奠基石？
http://bbs.pediy.com/showthread.php?t=202638 http://www.zhihu.com/topic/19671262/newest 2015年3月18日,微 ...
Centreon 监控报警
1.系统更新:yum update 2.安装组件:yum install -y httpd php-pear php php-mysql php-gd php-ldap php-xml php-mbs ...
twig一些常用的用法总结【原创】
在使用Symphony项目时,需要一些常用的twig,经过自己做的几个项目,自己的总结如下: 一.twig-数据判断有时候在使用后台传给前台数据时需要判断是否有这个值,(是否为空(”或null)或是 ...
测试工具之Charles视频教程（更新中。。。）
应群里小伙伴学习需求,录制新版 Charles V4 系列教程,后续内容抽空更新,测试工具系列带你上王者...(ノ°ο°)ノ前方高能预警链接:http://pan.baidu.com/s/1c16P ...
@Override报错
仔细看了下项目 , 是因为有人把project的信息传上来了 , 使用编译的JDK变成了1.5(难道是因为他的1.8的版本我没有 ?) , 右键项目, 选property , 把compiler变成1 ...
AX Dynamics 去中文字符长度：中文字符当2个字符处理
static void jw_testStrByteLen(Args _args){ str _str = "A你好"; System.Te ...

Python随机森林算法的使用

Python随机森林算法的使用的更多相关文章

随机推荐

热门专题