RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)

RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)

需要分析的文件:

右键分别创建读取excel数据,选择属性,设置对象,决策树算法这几个过程,然后连接起来

读取excel数据:【Insert Operator】—>【Import】—>【Data】—>【Read Excel】

选择属性:【Insert Operator】—>【Data Transformation】—>【Attribute Set Reduction and Transformation】—>【Selection】—>【Select Attributes】

设置对象:【Insert Operator】—>【Data Transformation】—>【Name and Role Modification】—>【Set Role】

决策树算法:【Insert Operator】—>【Modeling】—>【Classification and Regression】—>【Tree Induction】—>【Decision Tree】

点击【Read Excel】过程,右边出现



点击【Import Configuration Wizard】



全灰色表示全部选中,点击【Next】



第一栏的Name表示第一栏不是数据,如果不填就表示第一栏是跟下面的数据类型一样的,【Next】



体重变化只有两个值,选择【binominal】。点击【Finish】

点击【Select Attributes】过程中的【attribute filter type】选择【all】,对所有列进行分析

点击【Set Role】过程中的【attribute name】中的【体重变化】,【target role】中的【label】,以体重变化为主要研究对象

决策树算法按默认,

点击运行

生成决策树

1.Tree
2.指标1 > 5.883
3.| 指标2 > 9.843: 负 {负=2, 正=0}
4.| 指标2 ≤ 9.843
5.| | 指标3 > 9.868: 负 {负=2, 正=1}
6.| | 指标3 ≤ 9.868
7.| | | 指标2 > 8.645
8.| | | | 指标3 > 6.614: 负 {负=7, 正=0}
9.| | | | 指标3 ≤ 6.614
10.| | | | | 指标1 > 6.736: 正 {负=0, 正=11}
11.| | | | | 指标1 ≤ 6.736: 负 {负=1, 正=1}
12.| | | 指标2 ≤ 8.645: 正 {负=8, 正=182}
13.指标1 ≤ 5.883
14.| 指标3 > 0.027
15.| | 指标3 > 0.234
16.| | | 指标2 > 5.642: 负 {负=110, 正=0}
17.| | | 指标2 ≤ 5.642
18.| | | | 指标1 > 3.079
19.| | | | | 指标3 > 8.448: 负 {负=11, 正=0}
20.| | | | | 指标3 ≤ 8.448
21.| | | | | | 指标5 > 0.370
22.| | | | | | | 指标3 > 3.320
23.| | | | | | | | 指标4 > 0.559
24.| | | | | | | | | 指标1 > 3.369
25.| | | | | | | | | | 指标3 > 5.871
26.| | | | | | | | | | | 指标2 > 1.889
27.| | | | | | | | | | | | 指标1 > 5.517: 正 {负=0, 正=2}
28.| | | | | | | | | | | | 指标1 ≤ 5.517
29.| | | | | | | | | | | | | 指标5 > 8.864: 正 {负=0, 正=2}
30.| | | | | | | | | | | | | 指标5 ≤ 8.864: 负 {负=12, 正=0}
31.| | | | | | | | | | | 指标2 ≤ 1.889: 正 {负=0, 正=6}
32.| | | | | | | | | | 指标3 ≤ 5.871: 正 {负=0, 正=15}
33.| | | | | | | | | 指标1 ≤ 3.369: 负 {负=3, 正=0}
34.| | | | | | | | 指标4 ≤ 0.559: 负 {负=4, 正=0}
35.| | | | | | | 指标3 ≤ 3.320: 正 {负=0, 正=24}
36.| | | | | | 指标5 ≤ 0.370: 负 {负=2, 正=0}
37.| | | | 指标1 ≤ 3.079
38.| | | | | 指标2 > 0.268
39.| | | | | | 指标3 > 1.365: 负 {正=1, 负=64}
40.| | | | | | 指标3 ≤ 1.365
41.| | | | | | | 指标2 > 1.977
42.| | | | | | | | 指标1 > 1.829: 正 {负=1, 正=3}
43.| | | | | | | | 指标1 ≤ 1.829: 负 {负=7, 正=0}
44.| | | | | | | 指标2 ≤ 1.977: 正 {负=0, 正=2}
45.| | | | | 指标2 ≤ 0.268
46.| | | | | | 指标1 > 1.251: 正 {负=0, 正=3}
47.| | | | | | 指标1 ≤ 1.251: 负 {负=2, 正=0}
48.| | 指标3 ≤ 0.234
49.| | | 指标1 > 2.099: 正 {负=0, 正=7}
50.| | | 指标1 ≤ 2.099: 负 {负=2, 正=0}
51.| 指标3 ≤ 0.027: 正 {负=0, 正=2}

另外,对表数据读取过程右击,选择【Show ExampleSet Result】



可进行数据统计分析

RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)的更多相关文章

  1. 一个大数据的demo

    package test.admin; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.Fil ...

  2. sql把一个表数据插入到另一张表

    把一个表数据插入到另一张表 insert into tableB (field1,field2,field3,field4) select field1,field2,field3,'val4' fr ...

  3. MySQL 仅保留7天、一个月数据

    /************************************************************************** * MySQL 仅保留7天.一个月数据 * 说明 ...

  4. 如何创建一个要素数据类 IField,IFieldEdit,IFields,IFieldsEditI,GeometryDef,IGeometryDefEdit接口

    如何创建一个要素数据类 创建要素类用到了IFeatureWorkspace.CreateFeatureClass方法,在这个方法中有众多的参数,为了满足这些参数,我们要学习和了解下面的接口. IFie ...

  5. requests post一个json数据

    # post一个json数据 import requests headers={ "Accept":"application/json, text/plain, */*& ...

  6. 用寄快递模拟数据在网络中的传送过程,发送一个ip数据报到接受这个ip数据报经历的过程

    发送一个ip数据报到接受这个ip数据报经历的过程 好比寄一个快递的过程 这个包裹一共有三层, 这个包裹的最里面是数据,数据 第二层写着目的ip地址和源ip地址,即收件人和发件人的姓名 第三层也就是最外 ...

  7. Android 实现在Activity中操作刷新另外一个Activity数据列表

    做android项目中遇到这样一个问题:有两个acticity,一个显示好友列表,另外一个显示会话列表,现在问题是在会话界面增加一个添加好友功能,添加好友后要求实时的刷新好友列表. 想了想,找了两种方 ...

  8. 如何基于Go搭建一个大数据平台

    如何基于Go搭建一个大数据平台 - Go中国 - CSDN博客 https://blog.csdn.net/ra681t58cjxsgckj31/article/details/78333775 01 ...

  9. 用Python实现一个大数据搜索引擎

    用Python实现一个大数据搜索引擎 搜索是大数据领域里常见的需求.Splunk和ELK分别是该领域在非开源和开源领域里的领导者.本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家 ...

随机推荐

  1. js 多媒体audio video

    本文主要简单的介绍一下audio 和 video两个标签的用法 <audio src="music.mp3"></audio> <video src= ...

  2. An Data-Scientist Prepares 《数据科学家的自我修养》

    从今天开始,博主将用大概1000天的时间记录自己学习并成为初级数据科学家(数据分析师)的心路历程. 包括数据科学家所必需的的基础知识:数学,统计,计算机,商业,沟通能力等. 希望博主能够在2017前完 ...

  3. 多线程12_张孝祥 java5读写锁技术的妙用

    package locks; import java.util.Random; import java.util.concurrent.locks.ReentrantReadWriteLock; /* ...

  4. hdu 1908

    题意:一个人有一个代号K和一个优先等级P,一共有4种操作,0:结束,1:新建一个人,代号为K,优先等级为P,2:输出优先等级最大的人的代码,并删除该人,3:输出优先等级最小的人的代码,并删除该人. 用 ...

  5. PHP编程中10个最常见的错误

    PHP是一种非常流行的开源服务器端脚本语言,你在万维网看到的大多数网站都是使用php开发的.本篇经将为大家介绍PHP开发中10个最常见的问题,希望能够对朋友有所帮助. 错误1:foreach循环后留下 ...

  6. Python 入门之常见小问题

    1.在终端运行python,出现>>>即可输入代码回车进行执行,如果要退出,只需要执行exit()即可. -->在Python交互式命令行下,可以直接输入代码,然后执行,并立刻 ...

  7. doT.js 模板引擎的使用

    dot.js是一个模板框架,在web前端使用. dot.js作为模板引擎, 主要的用途就是,在写好的模板上,放进数据,生成含有数据的html代码. 这是很简单的web前端模板框架, 简单说几个东西,你 ...

  8. python练习_购物车(2)

    用python写了一个购物车程序,主要是练习,代码如下 主入口文件:main.py #!/usr/bin/env python # -*- coding:utf-8 -*- #先调用用户登录函数,在进 ...

  9. linux----LAMP之编译安装apache

    第一步:解决依赖.安装apr.apr-util. apr-1.5.4.tar.gz下载地址:http://yunpan.cn/cFBzgsC3rDcyR  访问密码 4c82 apr-util-1.5 ...

  10. SNMP_802.1

    http://www.cisco.com/en/US/tech/tk648/tk362/technologies_tech_note09186a00801c9199.shtml http://www. ...