R语言-数据高级管理
数学函数
abs() 绝对值
sqrt() 平方
ceiling() 向上取整
floor() 向下取整
trunc() 截取整数部分
round(x,digits = n) 保留几位小数
统计函数
mean() 均值
median() 中位数
sd() 标准差
var() 方差
mad() 绝对中位差
quantile() 分位数
diff() 滞后差分
scale(x,center = TRUE,scale = TRUE) 为数据对进行中心化和标准化
概率函数
dnorm() 密度函数
pnorm() 分布函数
qnorm() 分位数函数
rnorm() 随机生成函数
字符处理函数
nchar(x) 计算x中的字符数量
substr(x,start,stop) 提取或替换字符向量中的子串
grep(pattern,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索某种模式,若fixed=FALSE,则pattern 为一个正则表达式。
若fixed=TRUE,则pattern 为一个文本字符串。返回值为匹配的下标
grep("A",c("b","A","c"),fixed=TRUE)返回值为2
sub(pattern,replacement,x,ignore.case = FALSE,fixed = FALSE) 在x中搜索pattern,并以文本replacement将
其替换,若fixed=TRUE,则pattern 为一个文本字符串
sub("\\s",".","Hello There")返回值为Hello.There
strsplit(x,split,fixed = FALSE) 在spilt处分隔字符向量x中的元素。若fixed = FALSE,则pattern为一正则表达式,若fixed = TRUE,则 pattern为一个文本字符串
y <- strsplit("abc", "")将返回一个含有1 个成分、3 个元素的列表,包含的内容为"a" "b" "c"
paste(..,sep = "") 连接字符串,分隔符为sep
paste("x", 1:3,sep="")返回值为c("x1", "x2", "x3")
toupper(X) 大写转换
tolower(x) 小写转换
其他实用函数
length(x) 对象长度
seq(from,to,by)生成等差序列
rep(x,n) 将x重复n次
cut(x,n) 将连续型变量x分隔为有着n个水平的因子
pretty(x,n) 创建美观的分割点
cat(...,file = "myfile",append = FALSE) 连接 ...中的对象,并将其输出到屏幕上或文件中
firstname <- c("Jane")
cat("Hello" ,firstname, "\n")
\n 新行\t制表符\'单引号\b退格
apply(x, MARGIN, FUN, ...)
其中,x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,而...则包括了任何想传
递给FUN的参数。在矩阵或数据框中,MARGIN=1表示行,MARGIN=2表示列。
R语言-数据高级管理的更多相关文章
- R语言之内存管理
转载于:http://blog.csdn.net/hubifeng/article/details/41113789 在处理大型数据过程中,R语言的内存管理就显得十分重要,以下介绍几种常用的处理方法. ...
- 最棒的7种R语言数据可视化
最棒的7种R语言数据可视化 随着数据量不断增加,抛开可视化技术讲故事是不可能的.数据可视化是一门将数字转化为有用知识的艺术. R语言编程提供一套建立可视化和展现数据的内置函数和库,让你学习这门艺术.在 ...
- R语言数据接口
R语言数据接口 R语言处理的数据一般从外部导入,因此需要数据接口来读取各种格式化的数据 CSV # 获得data是一个数据帧 data = read.csv("input.csv" ...
- R语言数据的导入与导出
1.R数据的保存与加载 可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中. > a <- 1:10 > save(a,file='d://data/ ...
- R语言 数据重塑
R语言数据重塑 R语言中的数据重塑是关于改变数据被组织成行和列的方式. 大多数时间R语言中的数据处理是通过将输入数据作为数据帧来完成的. 很容易从数据帧的行和列中提取数据,但是在某些情况下,我们需要的 ...
- R语言数据预处理
R语言数据预处理 一.日期时间.字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date ...
- 第六篇:R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)
数据分布图简介 中医上讲看病四诊法为:望闻问切.而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样:闻:仔细分析数据是否合理:问:针对前两步工作搜集到的问题与业务方交流:切:结合业务方 ...
- 第五篇:R语言数据可视化之散点图
散点图简介 散点图通常是用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本. 同时散点图中常常还会拟合一些直线,以用来表示某些模型. 绘制基本散点图 本例选用如下测试数据集: 绘制 ...
- 第四篇:R语言数据可视化之折线图、堆积图、堆积面积图
折线图简介 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴. 但横轴也不一定是连续型变量,可以是有序的离散型变量. 绘制基本折线图 本例选用如下测试数据集: 绘制方法是首先 ...
随机推荐
- 字符数组和string判断是否为空行 NULL和0 namespace变量需要自己进行初始化
string 可以这样判断空行input !="" 字符数组可以通过判断第一个元素是否为空字符'\0',是的话为空行arrar[0]=='\0':或者用长度strlen(char ...
- 用H5和js写一个移动端自定义播放器
前言 由于html5自带的播放器样式不怎么好看,大多数人都是自己写一个来满足业务需求.这一次的需求如下: 1.不要上一曲下一曲 2.有进度条和播放暂停按钮 3.有时间显示 demo实现功能 1.进度条 ...
- Keepalived双机热备
一,Keepalived双机热备的应用场景 1,网站流量不高,压力不大,但是对服务器的可靠性要求极其高,例如实时在线OA系统,政府部门网站系统,医院实时报医系统,公安局在线报案系统,股市后台网站系统等 ...
- Python——Day3知识点——文件操作
一.打开文件 文件句柄 = open('文件路径', '模式') 打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作. 打开文件的模式有: r ...
- js 常见弹出框学习
模拟系统的弹出框 系统自带的弹出框 总结 链接 http://blog.csdn.net/anhuidelinger/article/details/17024491 参考这个网站学习模态框的动态弹 ...
- jenkins 中 Poll SCM 和 Build periodically 的区别
Build periodically 定时触发构建任务,不管远程代码分支上的代码是否发生变化,都执行一次构建. 示例:H 2 * * * 每天两点定时执行构建. Poll SCM:定时感知代码分支是否 ...
- angular使用echarts折线图
echarts是开源的画图工具,在angular框架中引入echarts不能直接使用.需要新建一个directive //echarts基本参数 app.factory('$echartsConfig ...
- UICollectionViewCell选中高亮状态和UIButton的高亮状态和选中状态
UICollectionViewCell选中高亮状态 //设置点击高亮和非高亮效果! - (BOOL)collectionView:(UICollectionView *)collectionView ...
- Python初学的易犯错误
当初学 Python 时,想要弄懂 Python 的错误信息的含义可能有点复杂.这里列出了常见的的一些让你程序 crash 的运行时错误. 1)忘记在 if , elif , else , for , ...
- 找回MSI安装包Win7/Win8管理员身份功能
找回MSI安装包Win7/Win8管理员身份功能 从Vista开始,系统引入了UAC用户控制功能,即普通用户运行exe软件安装程序,支持使用普通账户/管理员身份分别进行安装,但是msi安装包只支持默认 ...