5.2.1 数据函数

abs:

sqrt:

ceiling:求不小于x的最小整数

floor:求不大于x的最大整数

trunc:向0的方向截取x中的整数部分

round:将x舍入为指定位的小数

signif:舍入为指定的有效数字位数

cos,sin,tan

acos,asin,atan:反正弦,反余弦,反正切

cosh,sinh,tanh:双曲余弦,双曲正弦和双曲正切

acosh,asinh,atanh:反双曲余弦,反双曲正弦和反双曲正切

log(x,n):以n为底

log:

log10:

exp:

5.2.2 统计函数

mean

median:中位数

sd:标准差

var:方差

mad:绝对中位差

quantile:分位数

range:求值域

sum:

diff:滞后差分

min:

max:

scale:中心化(center=TRUE)或标准化(center=TRUE,scale=TRUE),按列.默认是对指定列进行均值为0,标准差为1的标准化.

5.2.3 概率函数

dnorm:密度函数

pnorm:分布函数

qnorm:分位数函数

rnorm:随机数生成函数

set.seed:指定随机数种子

runif:生成0到1区间上服从均匀分布的伪随机数

mvrnorm:多元正态分布数据

5.2.4 字符处理函数

nchar:计算字符数量

substr(x,start,stop):提取或替换一个字符向量中的子串

x<-"abcdef"

substr(x,2,4)结果是bcd

substr(x,2,4)<-"22222" x变成a222ef

grep(pattern,x,ignore.case=FALSE,fixed=FALSE):搜索,fixed=FALSE,pattern是正则,fixed=TRUE,pattern是一个文本字符串

sub(pattern,replacement,x,ignore.case=FALSE,fixed=FALSE):替换

strsplit(x,split,fixed=FALSE):在split处分割字符向量x中的元素

paste(...,sep="")

toupper:

tolower:

5.2.5 其他函数

length

seq(from,to,by)

rep(x,n)

cut(x,n)

pretty(x,n):创建美观的分割点

cat(...):连接,会在要连接的对象之间创建空格,可以用\b去掉这个空格

apply(x,margin,fun)

5.6

t:转置

5.6.2 整合数据

aggregate(x,by,FUN):by是一个list,按by中的变量聚合

5.6.3 reshape

melt(data,id=c())

cast(md,formula,FUN)

R语言实战读书笔记(五)高级数据管理的更多相关文章

  1. R语言实战读书笔记(四)基本数据管理

    4.2 创建新变量 几个运算符: ^或**:求幂 x%%y:求余 x%/%y:整数除 4.3 变量的重编码 with(): within():可以修改数据框 4.4 变量重命名 包reshape中有个 ...

  2. R语言实战读书笔记(二)创建数据集

    2.2.2 矩阵 matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames) 其中: byrow ...

  3. R语言实战读书笔记(三)图形初阶

    这篇简直是白写了,写到后面发现ggplot明显更好用 3.1 使用图形 attach(mtcars)plot(wt, mpg) #x轴wt,y轴pgabline(lm(mpg ~ wt)) #画线拟合 ...

  4. R语言实战读书笔记1—语言介绍

    第一章 语言介绍 1.1 典型的数据分析步骤 1.2 获取帮助 help.start() help("which") help.search("which") ...

  5. R语言实战读书笔记2—创建数据集(上)

    第二章 创建数据集 2.1 数据集的概念 不同的行业对于数据集的行和列叫法不同.统计学家称它们为观测(observation)和变量(variable) ,数据库分析师则称其为记录(record)和字 ...

  6. R语言实战读书笔记(八)回归

    简单线性:用一个量化验的解释变量预测一个量化的响应变量 多项式:用一个量化的解决变量预测一个量化的响应变量,模型的关系是n阶多项式 多元线性:用两个或多个量化的解释变量预测一个量化的响应变量 多变量: ...

  7. R语言实战读书笔记(七)基本统计分析

    summary() sapply(x,fun,options):对数据框或矩阵中的每一个向量进行统计 mean sd:标准差 var:方差 min: max: median: length: rang ...

  8. R语言实战读书笔记(一)R语言介绍

    1.3.3 工作空间 getwd():显示当前工作目录 setwd():设置当前工作目录 ls():列出当前工作空间中的对象 rm():删除对象 1.3.4 输入与输出 source():执行脚本

  9. R语言实战读书笔记(十三)广义线性模型

    # 婚外情数据集 data(Affairs, package = "AER") summary(Affairs) table(Affairs$affairs) # 用二值变量,是或 ...

随机推荐

  1. ios 分类(Category)

      今天研究了类别,都是网上找的资料,类别的作用 类别主要有3个作用:       (1)将类的实现分散到多个不同文件或多个不同框架中.       (2)创建对私有方法的前向引用.       (3 ...

  2. 小圣求职记A:腾讯篇

    本人普通985高校计算机专业研究生一枚,从9月12号开始正式找工作,一个月过去了,参加了能参加的各个互联网公司的宣讲.笔试.面试,现用两篇随笔分享所见所闻.随笔A将以腾讯为例详细展示整个过程,随笔B将 ...

  3. 浅谈 OneAPM 在 express 项目中的实践

    [编者按]OneAPM 运营团队,近日在 github 上发现了一篇文章,特别奉献给大家.本文作者王宇先生从2015年年初就开始使用我们的产品,也是OneAPM 的忠实用户. OneAPM 是一个优秀 ...

  4. POJ 2226

    Muddy Fields Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7557   Accepted: 2791 Desc ...

  5. POJ 1419

    #include <iostream> #define MAXN 105 #define max _max using namespace std; int j; bool _m[MAXN ...

  6. DF学Mysql(一)——数据库基本操作

    1.创建数据库 create Database <数据库名>; 注意:1)数据库名由字母.下划线.@.#和$组成 2)首字母不能是数字和$符号 3)不允许有空格和特殊字符 2.查看数据库 ...

  7. 刘汝佳 算法竞赛-入门经典 第二部分 算法篇 第五章 2(Big Number)

    这里的高精度都是要去掉前导0的, 第一题:424 - Integer Inquiry UVA:http://uva.onlinejudge.org/index.php?option=com_onlin ...

  8. ring0 与 ring3 层之间的交互

    在进行Windows的ring0层开发时,必不可免的要与 ring3 层进行交互.进行数据间的相互传输.可用的方法有DeviceIoCntrol,ReadFile.我平常都是用的DeviceIoCon ...

  9. 【hdu2815-Mod Tree】高次同余方程-拓展BadyStepGaintStep

    http://acm.hdu.edu.cn/showproblem.php?pid=2815 题意:裸题... 关于拓展BSGS的详细解释我写了一篇博文:http://www.cnblogs.com/ ...

  10. StructLayout特性(转)

    StructLayout特性 StructLayout特性          公 共语言运行库利用StructLayoutAttribute控制类或结构的数据字段在托管内存中的物理布局,即类或结构需要 ...