python 决策树

RID age income student credit_rating Class:buys_computer

1 youth high no fair no

2 youth high no excellent no

3 middle_aged high no fair no

4 senior medium no fair yes

5 senior low yes fair yes

6 senior low yes excellent no

7 middle_aged low yes excellent yes

8 youth medium no fair no

9 youth low yes fair yes

10 senior medium yes fair yes

11 youth medium yes excellent yes

12 middle_aged medium no excellent yes

13 middle_aged high yes fair yes

14 senior medium no excellent no

from sklearn.feature_extraction import DictVectorizer

from sklearn import preprocessing

from sklearn import tree

import csv

import numpy as np

all_csv_data = open('DT.csv', 'rt')

reader = csv.reader(all_csv_data)

header = next(reader)

feature_list = []

label_list = []

for row in reader:

    label_list.append(row[len(row) - 1])

    row_dict = {}

    for i in range(1, len(row)-1):

        row_dict[header[i]] = row[i]

    feature_list.append(row_dict)

#print(feature_list)

vec = DictVectorizer()

dummyX = vec.fit_transform(feature_list).toarray()

print(dummyX)

lb = preprocessing.LabelBinarizer()

dummyY = lb.fit_transform(label_list)

clf = tree.DecisionTreeClassifier(criterion = 'entropy')

clf = clf.fit(dummyX, dummyY)

with open("dt.dot", 'w') as f:

    f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(), out_file=f)

OneRowX = dummyX[0,:]

print("OneRowX:\n"+str(OneRowX))

#newRowX = OneRowX

#newRowX[0] = 1

#newRowX[1] = 0

#print("NewRowX:\n"+str(newRowX))

predY = clf.predict(dummyX)

print("predY :"+str(predY))

print("dummyX:"+str(np.array(dummyY).transpose()))

python 决策树的更多相关文章

Python决策树可视化：GraphViz's executables not found的解决方法
参考文献: [1]Python决策树可视化:GraphViz's executables not found的解决方法
Python——决策树实战：california房价预测
Python——决策树实战:california房价预测编译环境:Anaconda.Jupyter Notebook 首先,导入模块: import pandas as pd import matp ...
Python 决策树的构造
上一节我们学习knn,kNN的最大缺点就是无法给出数据的内在含义,而使用决策树处理分类问题,优势就在于数据形式非常容易理解. 决策树的算法有很多,有CART.ID3和C4.5等,其中ID3和C4.5都 ...
机器学习之路: python 决策树分类DecisionTreeClassifier 预测泰坦尼克号乘客是否幸存
使用python3 学习了决策树分类器的api 涉及到特征的提取,数据类型保留,分类类型抽取出来新的类型需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https: ...
我的spark python 决策树实例
from numpy import array from pyspark.mllib.regression import LabeledPoint from pyspark.mllib.tree im ...
【Spark机器学习速成宝典】模型篇05决策树【Decision Tree】（Python版）
目录决策树原理决策树代码(Spark Python) 决策树原理详见博文:http://www.cnblogs.com/itmorn/p/7918797.html 返回目录决策树代码(Spar ...
【Machine Learning】决策树案例：基于python的商品购买能力预测系统
决策树在商品购买能力预测案例中的算法实现作者:白宁超 2016年12月24日22:05:42 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本 ...
python画决策树
1.安装graphviz.下载地址在:http://www.graphviz.org/.如果你是linux,可以用apt-get或者yum的方法安装.如果是windows,就在官网下载msi文件安装. ...
决策树（含python源代码）
因为最近实习的需要,所以用python里的sklearn包重新写了一次决策树工具:sklearn,http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy:将 ...

随机推荐

JavaScript中数组的应用
Array的应用 1)创建 new Array();new Array(size);new Array(element,element,...,element); 2).Array对象属性 const ...
AsyncTask 的 get post 封装
1.get方法的封装AsyncTask public class DBUTil2 { public static interface Succee{ void onSuccee(String resu ...
debian shell脚本关联
懒得命令行一个个的输设置,MIME类型编辑,搜索x-shellscript,默认的改成/bin/bash即可
BT.656
转自http://www.cnblogs.com/s_agapo/archive/2012/04/08/2437775.html 凡是做模拟信号采集的,很少不涉及BT.656标准的,因为常见的模拟视频 ...
gridview使用小知识
1.列改变为select,不能使用gridview.SelectedRow.Cells[0].Text 2.事件执行顺序 RowCommandPageIndexChangingPageIndexCha ...
nginx1.14.0版本https加密配置
修改host文件,为最后访问域名准备 C:\Windows\System32\drivers\etc host文件目录192.168.10.140 www.joyce.com 在最后添加这个自定义域名 ...
Z 字形变换
将一个给定字符串根据给定的行数,以从上往下.从左到右进行 Z 字形排列. 比如输入字符串为 "LEETCODEISHIRING" 行数为 3 时,排列如下: L C I R E T ...
【安全测试自学】初探web安全处测试（二）
自学资料: 安全测试专家成长系列之-初探Web安全2.mp4 XSS攻击案例7:IPhone5 XSS盲打酷狗+后台SQL注射 CSRF即跨站请求伪造攻击: 举例: 上传漏洞: 危害: 文件包含漏洞 ...
HttpClient 302重定向
CloseableHttpClient是线程安全的,单个实例可用于处理多个HTTP请求,Http Client会自动处理所有的重定向,关闭自动重定向需要设定disableAutomaticRetrie ...
读取tensorflow的checkpoint里保存的参数
import tensorflow as tf from tensorflow.python import pywrap_tensorflow import os checkpoint_path = ...

python 决策树

python 决策树的更多相关文章

随机推荐

热门专题