用graphviz可视化决策树

simpleDi 2024-09-06 10:48:23 原文

1.安装graphviz。

graphviz本身是一个绘图工具软件，下载地址在：http://www.graphviz.org/。如果你是linux，可以用apt-get或者yum的方法安装。如果是windows，就在官网下载msi文件安装。无论是linux还是windows，装完后都要设置环境变量，将graphviz的bin目录加到PATH，比如我是windows，将C:/Program Files (x86)/Graphviz2.38/bin/加入了PATH

2.安装python插件graphviz。

python上有支持graphviz使用的import graphviz

3.安装python插件pydotplus。

import pydotplus

from IPython.display import Image

这样环境就搭好了，有时候python会很笨，仍然找不到graphviz，这时，可以在代码里面加入这一行：

os.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/'

注意后面的路劲是你自己的graphviz的bin目录。

4、绘图

#用决策树建模

clf = tree.DecisionTreeClassifier() #默认的选取最优节点的标准是基尼系数，若想使用信息增益则为entropy

clf = clf.fit(Xtrain, Ytrain)

score = clf.score(Xtest, Ytest) #返回预测的准确度

print(str(clf))

print(score)

#用graphviz会画得决策树(没有解决中文乱码的问题？？？十分苦恼)

输出PDF至项目文件夹：

import pydotplus

import os

from sklearn.externals.six import StringIO

os.environ["PATH"] += os.pathsep + 'E:\graphviz\bin'

dot_data = StringIO()

tree.export_graphviz(clf #模型

                            ,feature_names= feature_name  #tez

                            ,class_names=["琴酒","雪莉","贝尔摩德"] #类别名

                            ,filled=True    #由颜色标识不纯度

                            ,rounded=True   #树节点为圆角矩形

                            ,out_file=dot_data

                        )

graph = pydotplus.graph_from_dot_data(dot_data.getvalue())

graph.write_pdf("wine.pdf") #https://blog.csdn.net/chai_zheng/article/details/78226556

生成tree.dot文件，再用graphviz生成：

#生成tree.dot文件
with open("tree.dot", 'w') as f:

    f = tree.export_graphviz(clf

                            , feature_names = feature_name  # tez

                            , class_names = ["琴酒", "雪莉", "贝尔摩德"]  # 类别名

                            , filled = True  # 由颜色标识不纯度

                            , rounded = True  # 树节点为圆角矩形

                            ,out_file=f)

a）通过graphviz的exe程序导入dot文件生成相对应的png或者pdf文件

b）通过命令行dot -Tpdf tree.dot -o output.pdf，dot -Tpng tree.dot -o output.png将dot文件生成png或者pdf文件

用graphviz可视化决策树的更多相关文章

[决策树]西瓜数据graphviz可视化实现
[决策树]西瓜数据graphviz可视化实现一.问题描述: 使用西瓜数据集构建决策树,并将构建的决策树进行可视化操作. 二.问题简析: 首先我们简单的介绍一下什么是决策树.决策树是广泛用于分类和回归 ...
利用Graphviz 可视化GO 数据库
GO是一个同源蛋白的数据库,按照三大类别BP(生物学过程), MF(分子功能), CC(细胞组分) 对基因的产物-蛋白质进行了分类: 在GO数据库中,本质上是一个有向无环图的数据结构,在三大类别之下, ...
用 Graphviz 可视化函数调用
http://www.ibm.com/developerworks/cn/linux/l-graphvis/
Sklearn----使用决策树预测隐形眼镜类型
import pandas as pd import pydotplus from sklearn.externals.six import StringIO #LabelEncoder:将字符串转换 ...
用 Graphviz+pvtrace 可视化函数调用
最近在想怎么把一个程序的函数调用关系快速的用流程图的方式画出来,之后看到了这个一篇文章“用 Graphviz 可视化函数调用”(http://www.ibm.com/developerworks/cn ...
机器学习（Machine Learning）算法总结-决策树
一.机器学习基本概念总结分类(classification):目标标记为类别型的数据(离散型数据)回归(regression):目标标记为连续型数据有监督学习(supervised learnin ...
机器学习算法实践：决策树 (Decision Tree)（转载）
前言最近打算系统学习下机器学习的基础算法,避免眼高手低,决定把常用的机器学习基础算法都实现一遍以便加深印象.本文为这系列博客的第一篇,关于决策树(Decision Tree)的算法实现,文中我将对决 ...
通俗地说决策树算法（三）sklearn决策树实战
前情提要通俗地说决策树算法(一)基础概念介绍通俗地说决策树算法(二)实例解析上面两篇介绍了那么多决策树的知识,现在也是时候来实践一下了.Python有一个著名的机器学习框架,叫sklearn.我 ...
理解CART决策树
CART算法原理 CART全称为Classification and Regression Tree. 回归树相比ID3,CART遍历所有的特征和特征值,然后使用二元切分法划分数据子集,也就是每个 ...

随机推荐

Part 38 AngularJS cancel route change
n this video we will discuss, how to cancel route change in Angular with an example. This is extreme ...
GitHub出现Permission denied (publickey)
Permission denied (publickey) 没有权限的publickey 重新生成一次ssh key即可解决 ssh-keygen -t rsa -C "这里输入你的邮箱&q ...
Django笔记&教程 6-4 forms进阶操作，重写forms方法
Django 自学笔记兼学习教程第6章第4节--forms进阶操作,重写forms方法点击查看教程总目录 1 - 重写clean方法在本章第三节中,我们举了个注册学生账号的例子,里面我们使用模型来 ...
Django 小实例S1 简易学生选课管理系统 9 创建课程模型(model)
Django 小实例S1 简易学生选课管理系统第9节--创建课程模型(model) 点击查看教程总目录作者自我介绍:b站小UP主,时常直播编程+红警三,python1对1辅导老师. 对于课程模块, ...
Java数组声明
初始赋值值:例:一个二维数组,有二个1维数组组成,每一个一维数组有3个元素int[][] a = { {1,2,3}, {4,5,6} } ;动态二维数组声明:例:一个二维数组,有二个1维数组组成,每 ...
[Aizu2993]Invariant Tree
若$(i,j)\in E$,实际上会不断推出$(p_{i},p_{j})\in E,(p_{p_{i}},p_{p_{j}})\in E,...$ 考虑将$i$向$p_{i}$连边得到了一张(由若干个 ...
[cf1379F]Chess Strikes Back
考虑将$(2i-1,2j-1)$和$(2i,2j)$缩为一个点,记作$(i,j)$ 对于每一个点,只能选$(2i-1,2j-1)$或$(2i,2j)$(显然不能都选),而这样恰好为$nm$个,因此必须 ...
vue-通过name进行数据过滤
<template> <div> <h3>搜索列表</h3> <input type="text" placeholder=& ...
CF1511E Colorings and Dominoes
考虑计数拆开贡献. 因为在一个方案中一个格子最多只会贡献一次,那么不妨反过来求这个格子贡献了多少次. 然后发现,行列独立,那么我们单独计算红蓝色,即可. 一个偶数块贡献当且仅当前面也是偶数块. 然后显 ...
洛谷 P6071 『MdOI R1』Treequery（LCA+线段树+主席树）
题目链接题意:给出一棵树,有边权,\(m\) 次询问,每次给出三个数 \(p,l,r\),求边集 \(\bigcap\limits_{i=l}^rE(p,i)\) 中所有边的权值和. 其中 \(E( ...