数学函数

abs() 绝对值

sqrt() 平方

ceiling() 向上取整

floor() 向下取整

trunc() 截取整数部分

round(x,digits = n) 保留几位小数

统计函数

mean() 均值

median() 中位数

sd() 标准差

var() 方差

mad() 绝对中位差

quantile() 分位数

diff() 滞后差分

scale(x,center = TRUE,scale = TRUE) 为数据对进行中心化和标准化

概率函数

dnorm() 密度函数

pnorm()  分布函数

qnorm() 分位数函数

rnorm() 随机生成函数

字符处理函数

nchar(x) 计算x中的字符数量

substr(x,start,stop) 提取或替换字符向量中的子串

grep(pattern,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索某种模式,若fixed=FALSE,则pattern 为一个正则表达式。

若fixed=TRUE,则pattern 为一个文本字符串。返回值为匹配的下标

grep("A",c("b","A","c"),fixed=TRUE)返回值为2

sub(pattern,replacement,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索pattern,并以文本replacement将

其替换,若fixed=TRUE,则pattern 为一个文本字符串

sub("\\s",".","Hello There")返回值为Hello.There

strsplit(x,split,fixed = FALSE) 在spilt处分隔字符向量x中的元素。若fixed = FALSE,则pattern为一正则表达式,若fixed = TRUE,则         pattern为一个文本字符串

y <- strsplit("abc", "")将返回一个含有1 个成分、3 个元素的列表,包含的内容为"a" "b" "c"

paste(..,sep = "") 连接字符串,分隔符为sep

paste("x", 1:3,sep="")返回值为c("x1", "x2", "x3")

toupper(X) 大写转换

tolower(x) 小写转换

其他实用函数

length(x) 对象长度

seq(from,to,by)生成等差序列

rep(x,n) 将x重复n次

cut(x,n) 将连续型变量x分隔为有着n个水平的因子

pretty(x,n) 创建美观的分割点

cat(...,file = "myfile",append = FALSE) 连接 ...中的对象,并将其输出到屏幕上或文件中

firstname <- c("Jane")
      cat("Hello" ,firstname, "\n")

\n 新行\t制表符\'单引号\b退格

apply(x, MARGIN, FUN, ...)

其中,x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,而...则包括了任何想传
递给FUN的参数。在矩阵或数据框中,MARGIN=1表示行,MARGIN=2表示列。

R语言-数据高级管理的更多相关文章

  1. R语言之内存管理

    转载于:http://blog.csdn.net/hubifeng/article/details/41113789 在处理大型数据过程中,R语言的内存管理就显得十分重要,以下介绍几种常用的处理方法. ...

  2. 最棒的7种R语言数据可视化

    最棒的7种R语言数据可视化 随着数据量不断增加,抛开可视化技术讲故事是不可能的.数据可视化是一门将数字转化为有用知识的艺术. R语言编程提供一套建立可视化和展现数据的内置函数和库,让你学习这门艺术.在 ...

  3. R语言数据接口

    R语言数据接口 R语言处理的数据一般从外部导入,因此需要数据接口来读取各种格式化的数据 CSV # 获得data是一个数据帧 data = read.csv("input.csv" ...

  4. R语言数据的导入与导出

    1.R数据的保存与加载 可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中. > a <- 1:10 > save(a,file='d://data/ ...

  5. R语言 数据重塑

    R语言数据重塑 R语言中的数据重塑是关于改变数据被组织成行和列的方式. 大多数时间R语言中的数据处理是通过将输入数据作为数据帧来完成的. 很容易从数据帧的行和列中提取数据,但是在某些情况下,我们需要的 ...

  6. R语言数据预处理

    R语言数据预处理 一.日期时间.字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date ...

  7. 第六篇:R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

    数据分布图简介 中医上讲看病四诊法为:望闻问切.而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样:闻:仔细分析数据是否合理:问:针对前两步工作搜集到的问题与业务方交流:切:结合业务方 ...

  8. 第五篇:R语言数据可视化之散点图

    散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本. 同时散点图中常常还会拟合一些直线,以用来表示某些模型. 绘制基本散点图 本例选用如下测试数据集: 绘制 ...

  9. 第四篇:R语言数据可视化之折线图、堆积图、堆积面积图

    折线图简介 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴. 但横轴也不一定是连续型变量,可以是有序的离散型变量. 绘制基本折线图 本例选用如下测试数据集: 绘制方法是首先 ...

随机推荐

  1. C#小小总结(面向对象)

    前言 学c#也有一年的时间了 以前零零散散的记的一些笔记啊 随便之类的 没有写过比较整体一点的总结 所以现在写一个小小的总结 内容 一.面向对象 相信刚开始接触编程的童鞋都被这个概念弄糊涂过,对于刚刚 ...

  2. Spring Boot整合Activiti,查看流程图出现中文乱码问题

    最近研究SpringBoot 整合Activiti时,实现流程图高亮追踪是出现中文乱码问题,找了很多方法,现在把我最后的解决方法提供给大家. Spring Boot是微服务快速开发框架,强调的是零配置 ...

  3. MySQL集群在断网后再启动报"Unable to start missing node group"问题处理

    总所周知,MySQL集群又名ndb cluster,而ndb就是network based database的简称,数据库节点之间依靠网络来通信和保证数据分块间的一致性.今天由于机房交换机损坏,导致集 ...

  4. LintCode MinStack

    Implement a stack with min() function, which will return the smallest number in the stack. It should ...

  5. with as的用法

    ;with T1 as ( select FTP_ID,FTP_NAME,FTP_Server,FTP_Port,FTP_UserID,FTP_Password from FTP_Config wit ...

  6. pyodbc不支持使用%,应该使用?

    pyodbc不支持使用%,应该使用? 如: Sql插入语句cur.execute("INSERT INTO bb VALUES (?,?,?)","s",&qu ...

  7. junit单元测试(keeps the bar green to keeps the code clean)

    error是程序错误,failure是测试错误. junit概要: JUnit是由 Erich Gamma (设计模式的创始人)和 Kent Beck (敏捷开发的创始人之一)编写的一个回归测试框架( ...

  8. JUnit3的作用

    简要说JUnit的4大功能 1. 管理测试用例.修改了哪些代码,这些代码的修改会对哪些部分有影响,通过JUnit将这次的修改做个完整测试.这也就JUnit中所谓的TestSuite. 2. 定义测试代 ...

  9. iOS 按钮点击变色

    之前一直以为是要在selected状态下增加一个背景图片,效果是颜色变深,明明我的图片是变浅: 之后试了用hightlighted 成功. [_loginBtn setBackgroundImage: ...

  10. RDD与DataFrame的转换

    RDD与DataFrame转换1. 通过反射的方式来推断RDD元素中的元数据.因为RDD本身一条数据本身是没有元数据的,例如Person,而Person有name,id等,而record是不知道这些的 ...