一、均值

1.均值:mean(X)#计算所有元素的均值,包括矩阵、向量

2.行均值:apply(x,1,mean)

3.行均值:apply(x,2,mean)

注:如果x是数据框,则返回的就是向量

ex:mean(as.data.frame(x))

在做多元数据分析时,多元数据输入最好使用数据框的方式输入

4.在计算中某些数据是异常的,参数trim可以减少输入误差对计算的影响

ex:w.mean<-mean(w,trim=0.1)

0.1表示计算均值前需要去掉异常值的比例

5.有缺失值的时候无法计算均值,加上参数na.rm=TRUE可以计算有缺失值的均值

ex:w.mean<-mean(w.na,na.rm=TRUE);w.mean

6.加权向量

weight.mean(x,w,na.rm=TRUE)

x:数值向量

w:权值

二、顺序统计量

1.顺序排序

sort(x)

2.更广泛的功能

格式:sort(x,partial=NULL,na.last=NA,decreasing=FALSE,method=c("shell","quick"),index.return=FALSE)

partial:部分排序的指标向量

na.last:=NULL:不处理缺失数据;=FALSE缺失数据排在最后面;=TRUE缺失数据排在最前面

method:选择排序的方法。shell排序的复杂度为N的4/3次方,quick是快速排序

index.return:逻辑变量,TRUE为返回排序下标及排序结果,缺省为FASLE

decreasing:为TRUE时排序从大到小

三、中位数

中位数描述的是数据中心位置的数字特征,大体上比中位数或大或小的数据个数占整个数据的一半,对称分布的数据均值与中位数比较接近,偏态分布均值与中位数不同,中位数不受异常值的影响,具有稳健性

median(x,na.rm=TRUE):计算向量x的中位数,可处理有缺失值的数据

四:百分位数

quantile(x,probs=seq(0,1,0,25),na.rm=FASLE,names=TRUE,type=7,...)

probs:分位位置

五:方差、标准差、变异系数

变异系数是刻画数据相对分散性的一种度量记为CV=100*(s/x~)(%),x~为均值

方差:var(x)

标准差:sd(x)

协方差:cov(x)

相关矩阵:cor(x)

变异系数:cv=100*sd(x)/mean(x);cv

校正平方和:css=sum((w-mean(w))^2);css

未校正平方和:uss=sum(w^2);uss

样本极差:R=max(x)-min(x);R

样本标准误:sm=sd(x)/sqrt(length(x))

样本偏度系数:g1=n/((n-1)*(n-2))*sum((x-m)^3)/(sd(x))^3

样本峰度系数:g2=(n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3))#s=sd(x)

R中的基本函数运算的更多相关文章

  1. R中基本函数学习[转载]

    转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 ...

  2. 简单介绍一下R中的几种统计分布及常用模型

    统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...

  3. C++中的浮点数运算的误差测试分析

    C++中的浮点数运算的误差 项目中需要计算判定,采用的是float型,如: float a < yLing, 其中:a = 2.0, y则从1.0 + 0.2*n  当n = 4时,条件成立了? ...

  4. R语言编程艺术(2)R中的数据结构

    本文对应<R语言编程艺术>第2章:向量:第3章:矩阵和数组:第4章:列表:第5章:数据框:第6章:因子和表 ======================================== ...

  5. R中的sample函数

    今天介绍一些运算函数,它们的使用很简单,没有什么难度,但是也会用的着. 在医学统计学或者流行病学里的现场调查.样本选择经常会提到一个词:随机抽样.随机抽样是为了保证各比较组之间均衡性的一个很重要的方法 ...

  6. R 中的哪些命令或者包让你相见恨晚?--转载知乎

    https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Had ...

  7. (数据科学学习手札19)R中基本统计分析技巧总结

    在获取数据,并且完成数据的清洗之后,首要的事就是对整个数据集进行探索性的研究,这个过程中会利用到各种描述性统计量和推断性统计量来初探变量间和变量内部的基本关系,本篇笔者便基于R,对一些常用的数据探索方 ...

  8. R中的统计模型

    R中的统计模型 这一部分假定读者已经对统计方法,特别是回归分析和方差分析有一定的了解.后面我们还会假定读者对广义线性模型和非线性模型也有所了解.R已经很好地定义了统计模型拟合中的一些前提条件,因此我们 ...

  9. R中矩阵运算

    # 数据产生 # rnorm(n, mean = 0, sd = 1) 正态分布的随机数(r 代表随机,可以替换成dnorm, pnorm, qnorm 作不同计算.r= random = 随机, d ...

随机推荐

  1. dev 转自

    .隐藏最上面的GroupPanel gridView1.OptionsView.ShowGroupPanel=false; .得到当前选定记录某字段的值 sValue=Table.Rows[gridV ...

  2. 内置函数:max 用法

    内置函数——max Python max内置函数 max(iterable, *[, key, default]) max(arg1, arg2, *args[, key]) Return the l ...

  3. Linux中变量测试与内容替换

  4. 常用mongo语句

    只列出指定字段db.getCollection('PUBLICACCOUNTS').find({},{NickName:1,UserName:1,FID:1,_id:0})获取微信公众号列表db.ge ...

  5. 于win2008R2虽然激活,但是一个小时之后就会自动强制关机的问题

    写一个批处理文件: taskkill /f /im wlms.exeping -n  4 127.0.0.1shutdown -a 用记事本写下以上的命令,另存为.bat 批处理文件.双击运行,即可. ...

  6. 谷歌机器学习速成课程---3降低损失 (Reducing Loss):梯度下降法

    迭代方法图(图 1)包含一个标题为“计算参数更新”的华而不实的绿框.现在,我们将用更实质的方法代替这种华而不实的算法. 假设我们有时间和计算资源来计算 w1 的所有可能值的损失.对于我们一直在研究的回 ...

  7. js hash

    1)新建hash hash= {                 name  :  "image",                 "number" : &q ...

  8. 实现对第三方应用任意SO注入

    实现对第三方应用任意SO注入 0x01 应用在Android中运行,从外部对该进程可以进行任意SO文件动态注入,就是应用动态运行我们的SO文件 0x02 基本的逻辑是: 1.    获取目标进程的pi ...

  9. 如何成为专业的PHP开发者

    如何才能成为一名专业的PHP开发者?资深Web开发者Bruno Skvorc在其博客上分享了一些心得. 当阅读各种和PHP相关的博客.Quora问题.Google+社区.资讯和杂志的时候,Bruno ...

  10. 【LeetCode】【动态规划】表格移动问题

    前言 这里总结了两道表格移动的问题,分别是:Unique Paths 和 题一:Unique Paths 描述 A robot is located at the top-left corner of ...