Python简单实现决策树

 __author__ = '糖衣豆豆'

 #决策树

 import pandas as pda

 fname="~/coding/python/data/lesson.csv"

 dataf=pda.read_csv(fname,encoding="gbk")

 x=dataf.iloc[:,1:5].as_matrix()

 y=dataf.iloc[:,5].as_matrix()

 for i in range(0,len(x)):

     for j in range(0,len(x[i])):

         thisdata=x[i][j]

         if(thisdata=="是" or thisdata=="多" or thisdata=="高"):

             x[i][j]=int(1)

         else:

             x[i][j]=int(-1)

 for i in range(0,len(y)):

     thisdata=y[i]

     if(thisdata=="高"):

         y[i]=int(1)

     else:

         y[i]=int(-1)

 #容易错的地方:直接使用

 #正确的做法：转化好格式，将x,y转化为数据框，然后再转化为数组并指定格式

 xf=pda.DataFrame(x)

 yf=pda.DataFrame(y)

 x2=xf.as_matrix().astype(int)

 y2=yf.as_matrix().astype(int)

 #建立决策树

 from sklearn.tree import DecisionTreeClassifier as DTC

 dtc=DTC(criterion="entropy")

 dtc.fit(x2,y2)

 #直接预测决策树

 import numpy as npy

 x3=npy.array([[1,-1,-1,1],[1,1,1,1],[-1,1,-1,1]])

 rst=dtc.predict(x3)

 print(rst)

 #可视化决策树

 from sklearn.tree import export_graphviz

 from sklearn.externals.six import StringIO

 with open("~/Downloads/dtc.dot","w") as file:

     export_graphviz(dtc,feature_names=["combat","num","Promotion","datum"],out_file=file)


lesson.csv的日志如下

序号,实战,课时数,是否促销,是否提供配套资料,销量
1,是,多,是,否,高
2,否,少,是,是,低
3,是,少,是,否,低
4,是,多,否,否,低
5,是,少,否,是,高
6,是,多,是,是,高
7,否,多,是,否,低
8,否,少,是,是,高
9,是,多,是,否,高
10,否,少,否,否,低
11,是,少,否,否,高
12,否,多,是,否,低
13,是,少,否,是,高
14,是,多,否,是,高
15,否,少,是,是,低
16,是,多,否,否,低
17,是,多,否,否,低
18,是,多,否,是,高
19,否,多,是,否,高
20,是,少,否,是,低
21,是,多,否,否,高
22,否,少,是,是,低
23,否,少,否,否,低
24,否,多,是,是,高
25,是,少,否,是,高
26,是,多,否,否,低
27,是,多,是,是,高
28,否,少,否,否,低
29,是,少,是,是,高

Python简单实现决策树的更多相关文章

Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析.希望这篇 ...
Python简单爬虫入门三
我们继续研究BeautifulSoup分类打印输出 Python简单爬虫入门一 Python简单爬虫入门二前两部主要讲述我们如何用BeautifulSoup怎去抓取网页信息以及获取相应的图片标题等信 ...
Python简单爬虫入门二
接着上一次爬虫我们继续研究BeautifulSoup Python简单爬虫入门一上一次我们爬虫我们已经成功的爬下了网页的源代码,那么这一次我们将继续来写怎么抓去具体想要的元素首先回顾以下我们Bea ...
亲身试用python简单小爬虫
前几天基友分享了一个贴吧网页,有很多漂亮的图片,想到前段时间学习的python简单爬虫,刚好可以实践一下. 以下是网上很容易搜到的一种方法: #coding=utf-8 import urllib i ...
GJM : Python简单爬虫入门（二） [转载]
感谢您的阅读.喜欢的.有用的就请大哥大嫂们高抬贵手"推荐一下"吧!你的精神支持是博主强大的写作动力以及转载收藏动力.欢迎转载! 版权声明:本文原创发表于 [请点击连接前往] ,未经 ...
Selenium + PhantomJS + python 简单实现爬虫的功能
Selenium 一.简介 selenium是一个用于Web应用自动化程序测试的工具,测试直接运行在浏览器中,就像真正的用户在操作一样 selenium2支持通过驱动真实浏览器(FirfoxDrive ...
【美妙的Python之中的一个】Python简单介绍及环境搭建
美妙的Python之Python简单介绍及安装简而言之: Python 是能你无限惊喜的语言,与众不同. 1.Python: ...
python 简单图像识别--验证码
python 简单图像识别--验证码记录下,准备工作安装过程很是麻烦. 首先库:pytesseract,image,tesseract,PIL windows安装PIL,直接exe进行安装更方便( ...
python简单的监控脚本-利用socket、psutil阻止远程主机运行特定程序
python简单的监控脚本-利用socket.psutil阻止远程主机运行特定程序 psutil是一个跨平台的库(http://code.google.com/p/psutil/),能够轻松的实现获取 ...

随机推荐

No code signature found. 解决方式
除了网上常说的sudo chmod -R 777 /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/Deve ...
2019春第七周作业Compile Summarize
这个作业属于那个课程 C语言程序设计II 这个作业要求在哪里在这里我在这个课程的目标是能更加进一步的够熟练掌握指针的用法这个作业在那个具体方面帮助我实现目标指针对于基础题目的做法参考文献与 ...
Nginx实现负载均衡的简单案例
七层负载均衡的实现(Nginx): 基于URL等应用层信息的负载均衡,一般使用Nginx来实现 Nginx的proxy是它一个很强大的功能,实现了7层负载均衡功能强大.性能卓越.运行稳定配置简单灵 ...
【LeetCode每天一题】Unique Paths(唯一的路径数)
A robot is located at the top-left corner of a m x n grid (marked 'Start' in the diagram below).The ...
一分钟学会Xmind
常见mysql的慢查询优化方式
一,第一步.开启mysql慢查询方式一: 修改配置文件在 my.ini 增加几行: 主要是慢查询的定义时间(超过2秒就是慢查询),以及慢查询log日志记录( slow_query_log) 方 ...
[批处理]守护NodeJS进程
背景: 日常进行CI过程中,使用NodeJs方式:GIT更新->检测是否需要编译->调用IncrediBuilder编译->读取编译日志判断是否通过->调用7z打包问题: 持 ...
Log4j介绍与使用
Log4j三大组件 1) 日志记录器Logger负责输出日志信息,并能够对日志信息进行分类筛选,决定哪些日志信息应该被输出,哪些该被忽略.Loggers组件输出日志信息时分为5个级别:DEBUG.IN ...
Angular4 响应式编程
Oarcle之group by关键字与having关键字
group by关键字 *group by :分组由作用: 用于对于查询的数据进行分组并进行处理例如:select deptno ,job from emp group by deptno, ...

Python简单实现决策树

Python简单实现决策树的更多相关文章

随机推荐

热门专题