> library(maps) > library(geosphere) 载入需要的程辑包:sp > map("state")#画美国地图 > map("world")#画世界地图 > xlim<-c(-171.738281,-56.601563) > ylim<-c(12.039321,71.856229) > map("world",col="#f2f2f2",fill…
动态聚类:K-means方法 动态聚类:K-means方法 算法 选择K个点作为初始质心 将每个点指派到最近的质心,形成K个簇(聚类) 重新计算每个簇的质心 重复2-3直至质心不发生变化 kmeans()函数 > X=iris[,1:4]> km=kmeans(X,3)> kmK-means clustering with 3 clusters of sizes 62, 50, 38Cluster means: Sepal.Length Sepal.Width Petal.Length…
连线图 > a=c(2,3,4,5,6) > b=c(4,7,8,9,12) > plot(a,b,type="l") 多条曲线效果 plot(rain$Tokyo,type="l",col="red",ylim=c(0,300), main="Monthly Rainfall in major cities", xlab="Month of Year", ylab="Rainf…
主成分分析 主成分分析 Pearson于1901年提出的,再由Hotelling(1933)加以发展的一种多变量统计方法 通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目 可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析 成分的保留:Kaiser主张(1960)将特征值小于1的成分放弃,只保留特征值大于1的成分 如果能用不超过3-5个成分就能解释变异的80%,就算是成功 通过对原是变量进行线性组合,得到优化的指标 把原先多个指标的计算降维为少量几个经过优化指标的计…
回归诊断 回归诊断 1.样本是否符合正态分布假设? 2.是否存在离群值导致模型发生较大误差? 3.线性模型是否合理? 4.误差是否满足独立性.等方差.正态分布等假设条件? 5.是否存在多重共线性 正态分布检验:函数shapiro.test() P>0.05,正态分布 例题1 Anscomber数据 数据 1-3 1 2 3 4 4 号 X Y Y Y X Y 1 10.0 8.04 9.14 7.46 8.0 6.58 2 8.0 6.95 8.14 6.77 8.0 5.76 3 13.0 7…
广义线性回归模型 广义线性回归模型 例题1 R.Norell实验 为研究高压电线对牲畜的影响,R.Norell研究小的电流对农场动物的影响.他在实验中,选择了7头,6种电击强度, 0,1,2,3,4,5毫安,每头牛被电击30下,每种强度5下,按随机的次序进行,然后重复整个实验,每头牛总共被电击60下.对每次电击,相应变量--嘴巴运动,或者出现,或者未出现.下表中的数据给出每种电击强度70次试验中响应的总次数.试分析电击对牛的影响 电流(毫安) 试验次数 响应次数 响应的比例 0 70 0 0.0…
逐步回归 向前引入法:从一元回归开始,逐步加快变量,使指标值达到最优为止 向后剔除法:从全变量回归方程开始,逐步删去某个变量,使指标值达到最优为止 逐步筛选法:综合上述两种方法 多元线性回归的核心问题:应该选择哪些变量? RSS(残差平方和)与R2(相关系数平方)选择法:遍历所有可能的组合,选出使RSS最小,R2最大的模型 AIC(Akaike information criterion)准则和BIC(Bayesian information criterion)准则 AIC=n×ln(RSSP…
> x=iris[which(iris$Species=="setosa"),1:4] > plot(x) 首先是简单的肉眼观察数据之间相关性 多元回归相较于一元回归的最主要困难可能就是变量的选择,如下面的例子 使用Swiss数据集(R内置) Swiss Fertility and Socioeconomic Indicators(1888) Data 建立多元线性回归 > s=lm(Fertility~.,data=swiss) > print(s) Call…
R语言的各种分布函数 rnorm(n,mean=0,sd=1)#高斯(正态) rexp(n,rate=1)#指数 rgamma(n,shape,scale=1)#γ分布 rpois(n,lambda)#Poisson分布 rweibull(n,location=0,scale=1)#Weibull分布 rcauchy(n,location=0,scale=1)#Cauchy分布 rbeta(n,shape1,shape2)#β分布 rt(n,df)#t分布 rf(n,df1,df2)#F分布 r…
创建向量矩阵 > x1=c(2,3,6,8) > x2=c(1,2,3,4) > a1=(1:100) > length(a1) [1] 100 > length(x1) [1] 4 > mode(x1) [1] "numeric" > rbind(x1,x2) [,1] [,2] [,3] [,4] x1 2 3 6 8 x2 1 2 3 4 > cbind(x1,x2) x1 x2 [1,] 2 1 [2,] 3 2 [3,] 6 3…