R语言系统聚类分析1

#聚类分析是一类将数据所研究对象进行分类的统计方法，这一类方法的共同特点是：
#事先不知道类别的个数与结构据以进行分类的数据是对象之间的相似性或差异性数据
#将这些相似（相异）性数据看成是对象之间的距离远近的一种度量将距离近的对象
#归入一类不同类之间的对象距离较远
#聚类分析根据分类对象不同分为Q型聚类分析(指的是对样本进行聚类) 和R型聚类分析(指的是对变量进行聚类)

#距离和相似系数
#聚类分析是研究对样本或变量的聚类变量可以分为两类1定量变量通常指的是连续量
#2 定性变量(有序变量+名义变量) 这些量并非真有数量上的变化而只有性质上的差异

#1.距离 1绝对值距离棋盘距离城市街区距离 2 Euclide1距离 3Minkowski1距离 4切比雪夫距离 5 Mahalanobis距离 6LanceWilliams距离
#2.数据中心化标准化变换中心化变换标准化变换极差标准化变换极差正规化变换
#3.相似系数

X<-data.frame(

  x1=c(2959.19, 2459.77, 1495.63, 1046.33, 1303.97, 1730.84,

       1561.86, 1410.11, 3712.31, 2207.58, 2629.16, 1844.78,

       2709.46, 1563.78, 1675.75, 1427.65, 1783.43, 1942.23,

       3055.17, 2033.87, 2057.86, 2303.29, 1974.28, 1673.82,

       2194.25, 2646.61, 1472.95, 1525.57, 1654.69, 1375.46,

       1608.82),

  x2=c(730.79, 495.47, 515.90, 477.77, 524.29, 553.90, 492.42,

       510.71, 550.74, 449.37, 557.32, 430.29, 428.11, 303.65,

       613.32, 431.79, 511.88, 512.27, 353.23, 300.82, 186.44,

       589.99, 507.76, 437.75, 537.01, 839.70, 390.89, 472.98,

       437.77, 480.99, 536.05),

  x3=c(749.41, 697.33, 362.37, 290.15, 254.83, 246.91, 200.49,

       211.88, 893.37, 572.40, 689.73, 271.28, 334.12, 233.81,

       550.71, 288.55, 282.84, 401.39, 564.56, 338.65, 202.72,

       516.21, 344.79, 461.61, 369.07, 204.44, 447.95, 328.90,

       258.78, 273.84, 432.46),

  x4=c(513.34, 302.87, 285.32, 208.57, 192.17, 279.81, 218.36,

       277.11, 346.93, 211.92, 435.69, 126.33, 160.77, 107.90,

       219.79, 208.14, 201.01, 206.06, 356.27, 157.78, 171.79,

       236.55, 203.21, 153.32, 249.54, 209.11, 259.51, 219.86,

       303.00, 317.32, 235.82),

  x5=c(467.87, 284.19, 272.95, 201.50, 249.81, 239.18, 220.69,

       224.65, 527.00, 302.09, 514.66, 250.56, 405.14, 209.70,

       272.59, 217.00, 237.60, 321.29, 811.88, 329.06, 329.65,

       403.92, 240.24, 254.66, 290.84, 379.30, 230.61, 206.65,

       244.93, 251.08, 250.28),

  x6=c(1141.82, 735.97, 540.58, 414.72, 463.09, 445.20, 459.62,

       376.82, 1034.98, 585.23, 795.87, 513.18, 461.67, 393.99,

       599.43, 337.76, 617.74, 697.22, 873.06, 621.74, 477.17,

       730.05, 575.10, 445.59, 561.91, 371.04, 490.90, 449.69,

       479.53, 424.75, 541.30),

  x7=c(478.42, 570.84, 364.91, 281.84, 287.87, 330.24, 360.48,

       317.61, 720.33, 429.77, 575.76, 314.00, 535.13, 509.39,

       371.62, 421.31, 523.52, 492.60, 1082.82, 587.02, 312.93,

       438.41, 430.36, 346.11, 407.70, 269.59, 469.10, 249.66,

       288.56, 228.73, 344.85),

  x8=c(457.64, 305.08, 188.63, 212.10, 192.96, 163.86, 147.76,

       152.85, 462.03, 252.54, 323.36, 151.39, 232.29, 160.12,

       211.84, 165.32, 182.52, 226.45, 420.81, 218.27, 279.19,

       225.80, 223.46, 191.48, 330.95, 389.33, 191.34, 228.19,

       236.51, 195.93, 214.40),

  row.names=c("北京","天津","河北","山西","内蒙古",

              "辽宁","吉林","黑龙江","上海","江苏","浙江",

              "安徽","福建","江西","山东","河南","湖北",

              "湖南","广东","广西","海南","重庆","四川",

              "贵州","云南","西藏","陕西","甘肃","青海" ,

              "宁夏","新疆")          

)

d=dist(scale(X))   #scale对数据做中心化或者标准化处理

hc1<-hclust(d)   #hclust提供系统聚类的计算  最长距离法

plclust(hc1, hang=-)   #hang是表明谱系图中各类所在的位置 当hang取负值时，谱系图中的类从底部画起

re1<-rect.hclust(hc1, k=, border="red")

R语言系统聚类分析1的更多相关文章

R语言简单聚类分析
#以R基础包自带的鸢尾花(Iris)数据进行聚类分析iris data <- iris[,:] #系统聚类法(层次聚类法) distance <- dist(data) #计算距离 iri ...
用R语言对NIPS会议文档进行聚类分析
一.用R语言建立文档矩阵 (这里我选用的是R x64 3.2.2) (这里我取的是04年NIPS共计207篇文档做分析,其中文档内容已将开头的作者名和最后的参考文献进行过滤处理) ##1.Data I ...
R语言图形base系统（三）
本篇介绍R语言base系统绘制散点图.条形图.直方图.箱线图.饼图,还将简单介绍点图.核密度图.折线图. 散点图: attach(mtcars) plot(wt, mpg, main="B ...
R语言图形base系统（一）
一般R作图有三大绘图系统:base系统.ggplot2绘图系统.lattice绘图系统. 本篇主要介绍base系统绘图时的图形参数.一般用plot()函数来完成.在R中,若 ...
Windows7-32位系统下R语言链接mySQL数据库步骤
安装R和MySQL在此就不再多说了.网上有非常多教程能够找到.以下直接进入到odbc的安装流程. 1.下载安装mysql-connector-odbc-5.x.x-win32.msi 下载地址:htt ...
R语言图形base系统（二）
x<-c(1:10) y<-x z<-10/x opar<-par(no.readonly = T) par(mar=c(5,4,4,8)+0.1) plot(x,y,type ...
R语言重要数据集分析研究——需要整理分析阐明理念
1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标 ...
R语言一套内容从入门到放弃
[怪毛匠子整理] 1.下载 wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz 2.解压: tar -zxvf R-3.0. ...
R语言函数总结（转）
R语言特征对大小写敏感通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

随机推荐

HDU 4336 Card Collector(容斥)
题意:要收集n种卡片,每种卡片能收集到的概率位pi,求收集完这n种卡片的期望.其中sigma{pi} <=1; 思路:容斥原理.就是一加一减,那么如何算期望呢.如果用二进制表示,0表示未收集到, ...
javascript的面向对象编程
面象对象编程技术的核心理念:封装.继承.多态:在一些主流的高级编程语言中,比如:C#,VB.NET,JAVA,PHP等都是很容易实现的,而如果要在javascript中实现面象对象编程,可就不那么直接 ...
jQuery 遍历后代
后代是子.孙.曾孙等等. 通过 jQuery,您能够向下遍历 DOM 树,以查找元素的后代. 向下遍历 DOM 树下面是两个用于向下遍历 DOM 树的 jQuery 方法: children() f ...
[转]深入理解JavaScript系列
文章转自:汤姆大叔-深入理解JavaScript系列文章深入理解JavaScript系列文章,包括了原创,翻译,转载,整理等各类型文章,如果对你有用,请推荐支持一把,给大叔写作的动力. 深入理解Ja ...
Flex：CSS3布局利器
实习以来做了三个小控件,都是用的CSS2.1里传统的DIV+CSS布局方式,综合使用position.margin.float.BFC等属性或特性将元素放到指定的位置上.然而面对日益复杂的界面,这些来 ...
最小生成树之 prim算法和kruskal算法(以 hdu 1863为例)
最小生成树的性质 MST性质:设G = (V,E)是连通带权图,U是V的真子集.如果(u,v)∈E,且u∈U,v∈V-U,且在所有这样的边中, (u,v)的权c[u][v]最小,那么一定存在G的一棵最 ...
3D Game Programming with directx 11 习题答案 8.3
第八章第三题 1.将flare.dds和flarealpha.dds拷贝到工程目录 2.创建shader resource view HR(D3DX11CreateShaderResourceVie ...
jquery学习之旅
在jQuery中,css()方法的功能是设置或获取元素的某项样式属性. $<"div">.css("font-weight","bold& ...
虚拟化技术与"云"
虚拟化技术: 如网站在某一时间访问量大,平时访问量少,如果一直保持大量的服务器提供服务,显示效率好低,浪费资源,在不增减服务器,存储设备,网络等实际物理设备,而是利用软件将这些物理设备虚拟化,在有必 ...
.Net C/S系统开发框架(楚楚原创)
C/S系统开发框架-企业版 V4.0 (Enterprise Edition) 简介: http://www.csframework.com/cs-framework-4.0.htm 视频下载: 百度 ...

R语言 系统聚类分析1

R语言 系统聚类分析1的更多相关文章

随机推荐

热门专题

R语言系统聚类分析1

R语言系统聚类分析1的更多相关文章