R笔记1
gsub format
> measurements<-c('3.95*3.99*2.43mm','3*3*5mm','2*2*2mm')
> measurements
[1] "3.95*3.99*2.43mm" "3*3*5mm" "2*2*2mm"
> # 去掉mm后缀
> a<-gsub('mm','',measurements)
> a
[1] "3.95*3.99*2.43" "3*3*5" "2*2*2"
> library(plyr)
> ?strsplit
> # 用 * 将数据分隔开,并将列表型数据转换为数据框格式
> strsplit(a,'[*]')
[[1]]
[1] "3.95" "3.99" "2.43"
[[2]]
[1] "3" "3" "5"
[[3]]
[1] "2" "2" "2"
> res <-ldply(strsplit(a,'[*]'))
> # 重命名数据框
> names(res)<-c('L','W','H')
> # 更改各个变量的数据类型为数值型
> res
L W H
1 3.95 3.99 2.43
2 3 3 5
3 2 2 2
> str(res)
'data.frame': 3 obs. of 3 variables:
$ L: chr "3.95" "3" "2"
$ W: chr "3.99" "3" "2"
$ H: chr "2.43" "5" "2"
> res<- as.data.frame(sapply(res,FUN=as.numeric))
> head(res)
L W H
1 3.95 3.99 2.43
2 3.00 3.00 5.00
3 2.00 2.00 2.00
> str(res)
'data.frame': 3 obs. of 3 variables:
$ L: num 3.95 3 2
$ W: num 3.99 3 2
$ H: num 2.43 5 2
> #从定性角度,通过可视化来进行数据的探索性分析,强烈推荐使用GGally包中的ggpairs()函数,
> #该函数将绘制两辆变量的相关系数、散点图,同时也绘制出单变量的密度分布图
> library(ggplot2)
> library(GGally)
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> ggpairs(iris[,1:4])
> ggsave("aaaaa.png")
Saving 8.46 x 5.03 in image

> memory.limit() #查看系统规定的内存使用上限
[1] 4077
> memory.limit(newlimit)#更改到新的上限
Error in memory.limit(newlimit) : object 'newlimit' not found
> #养成清理内存的习惯
> rm(object) #删除变量
Warning message:
In rm(object) : object 'object' not found
> gc() #在rm()后,记得使用gc()做garbage collection ,否则内存是不会释放的,相当于没有做rm()
used (Mb) gc trigger (Mb) max used (Mb)
Ncells 1330209 71.1 2164898 115.7 2164898 115.7
Vcells 6475711 49.5 10202170 77.9 8435142 64.4
> td=data.frame(c('2016-01','2016-02'),stringsAsFactors =F)
> td
c..2016.01....2016.02..
1 2016-01
2 2016-02
> td2<- sapply(td,paste,"-01",sep="")
> td2
c..2016.01....2016.02..
[1,] "2016-01-01"
[2,] "2016-02-01"
> as.Date(td2[,1]) #画图用
[1] "2016-01-01" "2016-02-01"
> format(as.Date(td2[,1]),"%Y-%m")
[1] "2016-01" "2016-02"
R笔记1的更多相关文章
- R笔记(1):formula和Formula
#####开一个新的系列.关于R的一些笔记,就是遇到过的一些问题的简单整理.可能很基本,也可能没什么大的用处,作为一个记录而已.------------------------------------ ...
- 【R笔记】R语言函数总结
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...
- R笔记4:ggplot绘制商务图表--玫瑰图
我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图. Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 ...
- 【R笔记】使用R语言进行异常检测
本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局 ...
- 【R笔记】日期处理
R语言学习笔记:日期处理 1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed O ...
- 【R笔记】R的内存管理和垃圾清理
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm( ...
- 【R笔记】glm函数报错原因及解析
R语言glm函数学习: [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(for ...
- 【R笔记】给R加个编译器——notepad++
R的日记-给R加个编译器 转载▼ R是一款强大免费且开源的统计分析软件,这是R的长处,可也是其“缺陷”的根源:不似商业软件那样user-friendly.记得初学R时,给我留下最深印象的不是其功能的强 ...
- 【R笔记】R语言中的字符串处理函数
内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要.从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高.R语言提供了很多字符串操作函数,本文仅简 ...
- 【R笔记】order函数例子
问题: R中提供的例子不太懂,为什么得出的结果是6 5 2 1 7 4 10 8 3 9呢? (ii <- order(x <- c(1,1,3:1,1:4,3), y & ...
随机推荐
- Web 四种常见的POST提交数据方式
HTTP/1.1 协议规定的 HTTP 请求方法有 OPTIONS.GET.HEAD.POST.PUT.DELETE.TRACE.CONNECT 这几种.其中 POST 一般用来向服务端提交数据,本文 ...
- PHP设计模式(二)
从最近开始我给自己定了个目标,每周至少更新2篇博客,用来记录自己在上一周里面遇到的问题或者想出的新点子,一方面对自己掌握的知识进行记录,免得时间久了忘得一干二净,二来我的博文虽然不怎么好但也许会对一小 ...
- fzuoop期中练习
5-1 科学计数法的值 科学计数法是一种数学专用术语.将一个数表示成 a×10的n次幂的形式,其中1≤|a|<10,n为整数,这种记数方法叫科学计数法.例如920000可以表示为9.2*10^5 ...
- Java Servlet完全教程
Servlet 是一些遵从Java Servlet API的Java类,这些Java类可以响应请求.尽管Servlet可以响应任意类型的请求,但是它们使用最广泛的是响应web方面的请求. Servle ...
- 启动和关闭ADB服务(adb start-server和adb kill-server)
1 Android SDK中的常用命令行工具 在<Android SDK安装目录>\tools目录中带了很多命令行工具.虽然一般的开发人员并不需要完全掌握这些工具的使用方法,但了解这些工 ...
- 【项目】Http请求在NSMutableURLRequest添加HttpBody的字典params属性
在请求头中加入字典集合的Body,首先把字典转换成json,然后json转换成NSData,然后加入到HTTPBody中,我有已下写法 // 参数paramsNSDictionary * params ...
- LightOj1089(求点包含几个线段 + 线段树)
题目链接 题意:n( n <= 50000 ) 个线段,q ( q <= 50000) 个点,问每个点在几个线段上 线段端点的和询问的点的值都很大,所以必须离散化 第一种解法:先把所有的线 ...
- UVA1213Sum of Different Primes(素数打表 + DP)
题目链接 题意:选择k个素数,使得和为N(1120)的方案数: 筛选出 <= N 的素数,然后就背包 写的时候没初始dp[0][0] = 1;而且方案数也没相加,真是弱逼 #include &l ...
- shell 中 &&和||的方法
Shell && 和 || shell 在执行某个命令的时候,会返回一个返回值,该返回值保存在 shell 变量 $? 中.当 $? == 0 时,表示执行成功:当 $? == 1 时 ...
- 掘金chrome插件
掘金chrome插件 点击下载 掘金是一个高质量的互联网技术社区,而其提供的一个chrome插件个人觉得非常不错.最终效果如下所示: 每天都会有优秀的内容更新.