R语言简单聚类分析
#以R基础包自带的鸢尾花(Iris)数据进行聚类分析
iris
data <- iris[,:] #系统聚类法(层次聚类法)
distance <- dist(data) #计算距离
iris.hc <- hclust(distance) #聚类分析,计算距离方法是complete
plot( iris.hc, hang = -) #绘画系谱图
re <- rect.hclust(iris.hc, k = ) #分为三类
iris.id <- cutree(iris.hc, )
#生成列联表 将iris.id与iris中Species作比较发现:1应该是setosa类,2应该是virginica类(因为virginica的个数明显多于versicolor),3是versicolor。
table(iris.id, iris$Species) iris.hc1 <- hclust(distance,method="single")
plot(iris.hc1, hang = -) #绘画系谱图
re1 <- rect.hclust(iris.hc1, k = ) #分为三类 iris.hc2 <- hclust(distance,method="ward.D")
plot(iris.hc2, hang = -) #绘画系谱图
re2 <- rect.hclust(iris.hc2, k = ) #分为三类
iris.id2 <- cutree(iris.hc2, )
table(iris.id2, iris$Species) iris.hc3 <- hclust(distance,method="ward.D2")
plot(iris.hc3, hang = -) #绘画系谱图
re3 <- rect.hclust(iris.hc3, k = ) #分为三类 iris.hc4 <- hclust(distance,method="average")
plot(iris.hc4, hang = -) #绘画系谱图
re4 <- rect.hclust(iris.hc4, k = ) #分为三类 #plclust( iris.hc, labels = FALSE, hang = -) #不推荐使用
# dist <- dist(data.frame(id=c(,,,),a=c(,,,),b=c(,,,),c=c(,,,))) #动态聚类(逐步聚类法)
library("fpc")
kmeans <- kmeans(na.omit(data), )
plotcluster(na.omit(data), kmeans$cluster)
此处暂不截屏显示结果!
原文地址:http://blog.sciencenet.cn/blog-1114360-735780.html
R语言简单聚类分析的更多相关文章
- R语言简单介绍
R语言 概述 R语言是用于统计分析,图形表示和报告的编程语言和软件环境. R语言由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学创建,目前由R语言开发核心团队开发. R语言的 ...
- R语言-简单线性回归图-方法
目标:利用R语言统计描绘50组实验对比结果 第一步:导入.csv文件 X <- read.table("D:abc11.csv",header = TRUE, sep = & ...
- R语言简单入门
一.运行R语言可以做哪些事? 1.探索性数据分析(将数据绘制图表) 2.统计推断(根据数据进行预测) 3.回归分析(对数据进行拟合分析) 4.机器学习(对数据集进行训练和预测) 5.数据产品开发 二. ...
- R语言简单实现聚类分析计算与分析(基于系统聚类法)
聚类分析计算与分析(基于系统聚类法) 下面以一个具体的例子来实现实证分析.2008年我国其中31个省.市和自治区的农村居民家庭平均每人全年消费性支出. 根据原始数据对我国省份进行归类统计. 原始数据如 ...
- R语言 系统聚类分析1
#聚类分析是一类将数据所研究对象进行分类的统计方法,这一类方法的共同特点是:#事先不知道类别的个数与结构 据以进行分类的数据是对象之间的相似性 或差异性数据#将这些相似(相异)性数据看成是对象之间的距 ...
- R语言简单作图
以下函数只为满足常用的若干作图需求. 基本作图: plot(x).plot(x, y) #散点图,最多两个变量 #可使用参数type生成不同的效果图.常用'l'.'o'.'h',分别为折线图, ...
- R语言-简单模型画图
1.回归拟合 > plot(mtcars$mpg~mtcars$disp) > lmfit<-lm(mtcars$mpg~mtcars$disp) #线性回归模型 > abli ...
- R语言初涉
R语言简单的函数的使用: “<-”表示赋值,也可以用“=”. c()为连接函数,连接中间的数据表示向量,连接中间的数据表示向量,X1 <- c()表示用一组数据为变量X1赋值. mean( ...
- R语言学习笔记(五)绘图(1)
R是一个惊艳的图形构建平台,这也是R语言的强大之处.本文将分享R语言简单的绘图命令. 本文所使用的数据或者来自R语言自带的数据(mtcars)或者自行创建. 首先,让我们来看一个简单例子: ...
随机推荐
- arulesSequences包做序列模式的关联分析
实验数据: 实验文件: ? 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 021 02 ...
- vs2010 使用vs online账号 需要安装的插件
VS10SP1-KB2662296.exe http://pan.baidu.com/s/1qWDpEG0 vs2010 需要先升级到SP1
- ASP lable标签显示过长,自动换行。
<asp:Label ID="lab_BeforPostR" runat="server" CssClass="labSty" Wid ...
- AndroidStudio小技巧--依赖库
同步发表于http://avenwu.net/2015/02/12/androidstudio_library_dependency Fork on github https://github.com ...
- How to import library ?
Android Studio: Download or git the library. (for example: the library folder named ActionBarSherloc ...
- Google 面试题:Java实现用最大堆和最小堆查找中位数 Find median with min heap and max heap in Java
Google面试题 股市上一个股票的价格从开市开始是不停的变化的,需要开发一个系统,给定一个股票,它能实时显示从开市到当前时间的这个股票的价格的中位数(中值). SOLUTION 1: 1.维持两个h ...
- ubuntu 12 JDK 编译
下载openjdk源码 http://jdk7.java.net/source.html 安装Ubuntu上面的依赖包: .参考原书 环境变量配置: .去www.hzbook.com上面将深入理解ja ...
- 804 pretest 解题
Answers with Explanations 1. c) s1 and s2 not equal s1 and s3 equal JVM sets a constant pool in whic ...
- Windows内核安全与驱动开发
这篇是计算机中Windows Mobile/Symbian类的优质预售推荐<Windows内核安全与驱动开发>. 编辑推荐 本书适合计算机安全软件从业人员.计算机相关专业院校学生以及有一定 ...
- MMS关键指标意义&各数值区间意义
MMS关键指标意义&各数值区间意义 What's MMS MongoDB Management Service (MMS) is a suite of services for managin ...