R中的基本函数运算
一、均值
1.均值:mean(X)#计算所有元素的均值,包括矩阵、向量
2.行均值:apply(x,1,mean)
3.行均值:apply(x,2,mean)
注:如果x是数据框,则返回的就是向量
ex:mean(as.data.frame(x))
在做多元数据分析时,多元数据输入最好使用数据框的方式输入
4.在计算中某些数据是异常的,参数trim可以减少输入误差对计算的影响
ex:w.mean<-mean(w,trim=0.1)
0.1表示计算均值前需要去掉异常值的比例
5.有缺失值的时候无法计算均值,加上参数na.rm=TRUE可以计算有缺失值的均值
ex:w.mean<-mean(w.na,na.rm=TRUE);w.mean
6.加权向量
weight.mean(x,w,na.rm=TRUE)
x:数值向量
w:权值
二、顺序统计量
1.顺序排序
sort(x)
2.更广泛的功能
格式:sort(x,partial=NULL,na.last=NA,decreasing=FALSE,method=c("shell","quick"),index.return=FALSE)
partial:部分排序的指标向量
na.last:=NULL:不处理缺失数据;=FALSE缺失数据排在最后面;=TRUE缺失数据排在最前面
method:选择排序的方法。shell排序的复杂度为N的4/3次方,quick是快速排序
index.return:逻辑变量,TRUE为返回排序下标及排序结果,缺省为FASLE
decreasing:为TRUE时排序从大到小
三、中位数
中位数描述的是数据中心位置的数字特征,大体上比中位数或大或小的数据个数占整个数据的一半,对称分布的数据均值与中位数比较接近,偏态分布均值与中位数不同,中位数不受异常值的影响,具有稳健性
median(x,na.rm=TRUE):计算向量x的中位数,可处理有缺失值的数据
四:百分位数
quantile(x,probs=seq(0,1,0,25),na.rm=FASLE,names=TRUE,type=7,...)
probs:分位位置
五:方差、标准差、变异系数
变异系数是刻画数据相对分散性的一种度量记为CV=100*(s/x~)(%),x~为均值
方差:var(x)
标准差:sd(x)
协方差:cov(x)
相关矩阵:cor(x)
变异系数:cv=100*sd(x)/mean(x);cv
校正平方和:css=sum((w-mean(w))^2);css
未校正平方和:uss=sum(w^2);uss
样本极差:R=max(x)-min(x);R
样本标准误:sm=sd(x)/sqrt(length(x))
样本偏度系数:g1=n/((n-1)*(n-2))*sum((x-m)^3)/(sd(x))^3
样本峰度系数:g2=(n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3))#s=sd(x)
R中的基本函数运算的更多相关文章
- R中基本函数学习[转载]
转自:https://www.douban.com/note/511740050/ 1.数据管理 numeric:数值型向量 logical:逻辑型向量 character:字符型向量list:列表 ...
- 简单介绍一下R中的几种统计分布及常用模型
统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...
- C++中的浮点数运算的误差测试分析
C++中的浮点数运算的误差 项目中需要计算判定,采用的是float型,如: float a < yLing, 其中:a = 2.0, y则从1.0 + 0.2*n 当n = 4时,条件成立了? ...
- R语言编程艺术(2)R中的数据结构
本文对应<R语言编程艺术>第2章:向量:第3章:矩阵和数组:第4章:列表:第5章:数据框:第6章:因子和表 ======================================== ...
- R中的sample函数
今天介绍一些运算函数,它们的使用很简单,没有什么难度,但是也会用的着. 在医学统计学或者流行病学里的现场调查.样本选择经常会提到一个词:随机抽样.随机抽样是为了保证各比较组之间均衡性的一个很重要的方法 ...
- R 中的哪些命令或者包让你相见恨晚?--转载知乎
https://www.zhihu.com/question/24501195 节选: 看了这么多答案,觉得 Hadley Wickhamhad.co.nz 在R使用者的地位好高啊.其实我也觉得Had ...
- (数据科学学习手札19)R中基本统计分析技巧总结
在获取数据,并且完成数据的清洗之后,首要的事就是对整个数据集进行探索性的研究,这个过程中会利用到各种描述性统计量和推断性统计量来初探变量间和变量内部的基本关系,本篇笔者便基于R,对一些常用的数据探索方 ...
- R中的统计模型
R中的统计模型 这一部分假定读者已经对统计方法,特别是回归分析和方差分析有一定的了解.后面我们还会假定读者对广义线性模型和非线性模型也有所了解.R已经很好地定义了统计模型拟合中的一些前提条件,因此我们 ...
- R中矩阵运算
# 数据产生 # rnorm(n, mean = 0, sd = 1) 正态分布的随机数(r 代表随机,可以替换成dnorm, pnorm, qnorm 作不同计算.r= random = 随机, d ...
随机推荐
- bfs_迷宫求最短路径
宽度优先搜索按照距离开始状态由近及远的顺序进行搜索,可以很容易用来求解最短路径或者最少操作等问题. 将已经访问过的状态用标记管理起来,便可以很好地做到由近及远的搜索. import java.util ...
- iOS 多线程之 NSOperation 的基本使用
1.NSOperation,NSOperationQueue 简介 NSOperation,NSOperationQueue是苹果提供给我们的一套多线程解决方案.实际上 NSOperation.NSO ...
- Python菜鸟之路:Jquery Ajax的使用
Ajax概述 Ajax就是通过 HTTP 请求加载远程数据.通常用于定制一些http请求来灵活的完成前端与后端的数据交互需求. 注意,所有的选项都可以通过$.ajaxSetup()函数来全局设置. J ...
- python Flask框架CBV视图
1.演示之前需要先写一个装饰器 # 装饰器 def wrapper(func): def inner(*args, **kwargs): print('操作函数%s之前' % func.__name_ ...
- xml数据发送请求,读取xml
# coding:utf-8 import requests url = "http://httpbin.org/post" # python3字符串换行,在右边加个反斜杠 bod ...
- 【算法题 14 LeetCode 147 链表的插入排序】
算法题 14 LeetCode 147 链表的插入排序: 解题代码: # Definition for singly-linked list. # class ListNode(object): # ...
- 剑指offer 面试10题
面试10题: 题目:大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项.n<=39 n=0时,f(n)=0 n=1时,f(n)=1 n>1时,f(n)=f(n-1 ...
- Amazon2014在线笔试 第三题
问题描述: 算法分析: s1:层数对齐:分别求两个数所在的层(l1,l2),把层数大的(假设l2>l1)先往上找父节点,从而对齐到l1层: s2:两个数同时往上找, 直到找到公共的父节点(一定能 ...
- Python进阶(4)_进程与线程 (python并发编程之多进程)
一.python并发编程之多进程 1.1 multiprocessing模块介绍 由于GIL的存在,python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大 ...
- GitHub命名规则
● Added ( 新加入的需求 ) ● Fixed ( 修复 bug ) ● Changed ( 完成的任务 ) ● Updated ( 完成的任务,或者由于第三方模块变化而做的变化 )