数学函数

abs() 绝对值

sqrt() 平方

ceiling() 向上取整

floor() 向下取整

trunc() 截取整数部分

round(x,digits = n) 保留几位小数

统计函数

mean() 均值

median() 中位数

sd() 标准差

var() 方差

mad() 绝对中位差

quantile() 分位数

diff() 滞后差分

scale(x,center = TRUE,scale = TRUE) 为数据对进行中心化和标准化

概率函数

dnorm() 密度函数

pnorm()  分布函数

qnorm() 分位数函数

rnorm() 随机生成函数

字符处理函数

nchar(x) 计算x中的字符数量

substr(x,start,stop) 提取或替换字符向量中的子串

grep(pattern,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索某种模式,若fixed=FALSE,则pattern 为一个正则表达式。

若fixed=TRUE,则pattern 为一个文本字符串。返回值为匹配的下标

grep("A",c("b","A","c"),fixed=TRUE)返回值为2

sub(pattern,replacement,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索pattern,并以文本replacement将

其替换,若fixed=TRUE,则pattern 为一个文本字符串

sub("\\s",".","Hello There")返回值为Hello.There

strsplit(x,split,fixed = FALSE) 在spilt处分隔字符向量x中的元素。若fixed = FALSE,则pattern为一正则表达式,若fixed = TRUE,则         pattern为一个文本字符串

y <- strsplit("abc", "")将返回一个含有1 个成分、3 个元素的列表,包含的内容为"a" "b" "c"

paste(..,sep = "") 连接字符串,分隔符为sep

paste("x", 1:3,sep="")返回值为c("x1", "x2", "x3")

toupper(X) 大写转换

tolower(x) 小写转换

其他实用函数

length(x) 对象长度

seq(from,to,by)生成等差序列

rep(x,n) 将x重复n次

cut(x,n) 将连续型变量x分隔为有着n个水平的因子

pretty(x,n) 创建美观的分割点

cat(...,file = "myfile",append = FALSE) 连接 ...中的对象,并将其输出到屏幕上或文件中

firstname <- c("Jane")
      cat("Hello" ,firstname, "\n")

\n 新行\t制表符\'单引号\b退格

apply(x, MARGIN, FUN, ...)

其中,x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,而...则包括了任何想传
递给FUN的参数。在矩阵或数据框中,MARGIN=1表示行,MARGIN=2表示列。

R语言-数据高级管理的更多相关文章

  1. R语言之内存管理

    转载于:http://blog.csdn.net/hubifeng/article/details/41113789 在处理大型数据过程中,R语言的内存管理就显得十分重要,以下介绍几种常用的处理方法. ...

  2. 最棒的7种R语言数据可视化

    最棒的7种R语言数据可视化 随着数据量不断增加,抛开可视化技术讲故事是不可能的.数据可视化是一门将数字转化为有用知识的艺术. R语言编程提供一套建立可视化和展现数据的内置函数和库,让你学习这门艺术.在 ...

  3. R语言数据接口

    R语言数据接口 R语言处理的数据一般从外部导入,因此需要数据接口来读取各种格式化的数据 CSV # 获得data是一个数据帧 data = read.csv("input.csv" ...

  4. R语言数据的导入与导出

    1.R数据的保存与加载 可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中. > a <- 1:10 > save(a,file='d://data/ ...

  5. R语言 数据重塑

    R语言数据重塑 R语言中的数据重塑是关于改变数据被组织成行和列的方式. 大多数时间R语言中的数据处理是通过将输入数据作为数据帧来完成的. 很容易从数据帧的行和列中提取数据,但是在某些情况下,我们需要的 ...

  6. R语言数据预处理

    R语言数据预处理 一.日期时间.字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date ...

  7. 第六篇:R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

    数据分布图简介 中医上讲看病四诊法为:望闻问切.而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样:闻:仔细分析数据是否合理:问:针对前两步工作搜集到的问题与业务方交流:切:结合业务方 ...

  8. 第五篇:R语言数据可视化之散点图

    散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本. 同时散点图中常常还会拟合一些直线,以用来表示某些模型. 绘制基本散点图 本例选用如下测试数据集: 绘制 ...

  9. 第四篇:R语言数据可视化之折线图、堆积图、堆积面积图

    折线图简介 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴. 但横轴也不一定是连续型变量,可以是有序的离散型变量. 绘制基本折线图 本例选用如下测试数据集: 绘制方法是首先 ...

随机推荐

  1. flash 居中问题

    如果舞台是1000的宽度,要剧中比较容易 mc1.x = (1000-400)/2; 这样就居中了,来看原理,首先我们要舞台居中,很容易就想到一个数字 1000/2 结果是500 但是x对舞台的中央是 ...

  2. PHP乱码完美解决

    文章来源  http://www.lupaworld.com/forum.php?mod=viewthread&tid=148807 A.首先说下HTML中文乱码问题的解决方法. 比如有个in ...

  3. [转] 使用 MYSQLBINLOG 来恢复数据

     使用 MYSQLBINLOG 来恢复数据 2009-04-05 12:47:05 标签:mysql mysqlbinlog 恢复 数据库 数据 原创作品,允许转载,转载时请务必以超链接形式标明文章 ...

  4. 问题:C++形参默认值为什么一定要放在最后?

    问题:C++形参默认值为什么一定要放在最后? 1.会出现歧义! 2.从汇编角度看是怎么回事?   待解答!!

  5. Max Points on a Line

    Given n points on a 2D plane, find the maximum number of points that lie on the same straight line. ...

  6. Installshield如何实现升级覆盖文件

    这个简单的问题,问过的人不计其数,但是反馈者寥寥,并且往往不能顺利达成目标,只能采取复杂方式来实现,这里吐槽一下IS的帮助文档,很庞大很全,但是有些小技巧就是不讲. 网友冰雪孤独哥今天提供了及时的反馈 ...

  7. 利用 ipset 封禁大量 IP

    使用 iptables 封 IP,是一种比较简单的应对网络攻击的方式,也算是比较常见.有时候可能会封禁成千上万个 IP,如果添加成千上万条规则,在一台注重性能的服务器或者本身性能就很差的设备上,这就是 ...

  8. sublime text 2 ubuntu安装及插件管理

    参考 dudumao 1.下载Sublime Text2官网下载地址:http://www.sublimetext.com 2.安装Sublime Text2解压即可使用 $ sudo tar -jx ...

  9. 推荐系统学习--cb+cf 初见

    对于推荐系统的推出有两个条件:1.信息过载 ,2用户没有明确的需求 推荐系统算法中常见的有基于内容推荐,协同过滤推荐,协同过滤还可以分为基于人的协同过滤,基于内容协同过滤:社会推荐等 如何理解这些推荐 ...

  10. CoreData数据库

        一  CoreData 了解 1 CoreData 数据持久化框架是 Cocoa API 的一部分,首先在iOSS5 版本的系统中出现:      它允许按照 实体-属性-值 模式组织数据: ...