【R笔记】日期处理
R语言学习笔记:日期处理
1、取出当前日期
Sys.Date()
[1] "2014-10-29"
date() #注意:这种方法返回的是字符串类型
[1] "Wed Oct 29 20:36:07 2014"
2、在R中日期实际是double类型,是从1970年1月1日以来的天数
typeof(Sys.Date())
[1] "double"
3、转换为日期
用as.Date()可以将一个字符串转换为日期值,默认格式是yyyy-mm-dd。
as.Date("2007-02-01") #得到"2007-02-01",显示为字符串,但实际是用double存储的
as.double(as.Date("1970-01-01")) #结果为0,是从1970年1月1日以来的天数。
可以把定制的日期字符串转换为日期型
as.Date("2007年2月1日", "%Y年%m月%d日")
[1] "2007-02-01"
格式
意义
%Y
年份,以四位数字表示,2007
%m
月份,以数字形式表示,从01到12
%d
月份中当的天数,从01到31
%b
月份,缩写,Feb
%B
月份,完整的月份名,指英文,February
%y
年份,以二位数字表示,07
4、把日期值输出为字符串
today <- Sys.Date()
format(today, "%Y年%m月%d日")
[1] "2014年10月29日"
5、计算日期差
由于日期内部是用double存储的天数,所以是可以相减的。
today <- Sys.Date()
gtd <- as.Date("2011-07-01") #我是从2011年7月开始实践Get Things Done(GTD)的
today - gtd
Time difference of 1216 days
原来我到今天为止已经实践GTD有1216天了。
用difftime()函数可以计算相关的秒数、分钟数、小时数、天数、周数
difftime(today, gtd, units="weeks") #还可以是“secs”, “mins”, “hours”, “days”
Time difference of 173.7143 weeks
案例1:绘图日期变化
继续用R语言解决一个我的实际问题:统计fitbit计步器中的数据并绘图
# 读入CSV格式的fitbit统计数据
fitbit <- read.csv("fitbit.csv")
# 日期要转换一下
fitbit$date <- as.Date(fitbit$date, "%Y年%m月%d日")
# 画图,只画线
plot(fitbit$date, fitbit$step, type="l")

# 只统计八月的运动情况
fitbit8 <- fitbit[months(fitbit$date)=="八月", ]
plot(fitbit8$date, fitbit8$step, type="l")

6、日期型数据
在R中自带的日期形式为:as.Date();以数值形式存储;
对于规则的格式,则不需要用format指定格式;如果输入的格式不规则,可以通过format指定的格式读入;
标准格式:
年-月-日或者年/月/日;如果不是以上二种格式,则会提供错误;
as.Date('23-2013-1')
错误于charTo按照Date(x) : 字符串的格式不够标准明确
> as.Date('23-2013-1',format='%d-%Y-%m')
[1] "2013-01-23"
格式
意义
%d
月份中当的天数
%m
月份,以数字形式表示
%b
月份,缩写
%B
月份,完整的月份名,指英文
%y
年份,以二位数字表示
%Y
年份,以四位数字表示
#其它日期相关函数
weekdays()取日期对象所处的周几;
months()取日期对象的月份;
quarters()取日期对象的季度;
#POSIX类
The POSIXct class stores date/time values as the number of seconds since January 1, 1970, while the POSIXlt class stores them as a list with elements for second, minute, hour, day, month, and year, among others.
POSIXct 是以1970年1月1号开始的以秒进行存储,如果是负数,则是1970年以前;正数则是1970年以后。(unix时间戳)
POSIXlt 是以列表的形式存储:年、月、日、时、分、秒;
mydate = as.POSIXlt(’2005-4-19 7:01:00’)
names(mydate)
默认情况下,日期之前是以/或者-进行分隔,而时间则以:进行分隔;
输入的标准格式为:日期 时间(日期与时间中间有空隔隔开)
时间的标准格式为:时:分 或者 时:分:秒;
如果输入的格式不是标准格式,则同样需要使用strptime函数,利用format来进行指定;
#生成案例数据
Dates <- c("2009-09-28","2010-01-15")
Times <- c( "23:12:55", "10:34:02")
charvec <- timeDate(paste(Dates, Times))
timeDate(charvec)
#取系统的时间
Sys.timeDate()
#一个月的第一天
timeFirstDayInMonth()
#一个月的最后一天
timeLastDayInMonth()
#一周当中第几天
dayOfWeek()
#一年当中的第几天
dayOfYear()
7、unix时间戳转换成普通时间的方法
> dts = c(1127056501,1104295502,1129233601,1113547501,
+ 1119826801,1132519502,1125298801,1113289201)
> mydates = dts
> class(mydates) = c('POSIXt','POSIXct')
> mydates
[1] "2005-09-18 08:15:01 PDT" "2004-12-28 20:45:02 PST"
[3] "2005-10-13 13:00:01 PDT" "2005-04-14 23:45:01 PDT"
[5] "2005-06-26 16:00:01 PDT" "2005-11-20 12:45:02 PST"
[7] "2005-08-29 00:00:01 PDT" "2005-04-12 00:00:01 PDT"
Sys.Date( ) returns today's date.
date() returns the current date and time.
# print today's date
today <-Sys.Date()
format(today, format="%B %d %Y")
"June 20 2007"
# convert date info in format 'mm/dd/yyyy'
strDates <- c("01/05/1965", "08/16/1975")
dates <- as.Date(strDates, "%m/%d/%Y")
# convert dates to character data
strDates <- as.character(dates)
--------------------------------------
> as.Date('1915-6-16')
[1] "1915-06-16"
> as.Date('1990/02/17')
[1] "1990-02-17"
> as.Date('1/15/2001',format='%m/%d/%Y')
[1] "2001-01-15"
> as.Date('April 26, 2001',format='%B %d, %Y')
[1] "2001-04-26"
> as.Date('22JUN01',format='%d%b%y') # %y is system-specific; use with caution
[1] "2001-06-22"
> bdays = c(tukey=as.Date('1915-06-16'),fisher=as.Date('1890-02-17'),
+ cramer=as.Date('1893-09-25'), kendall=as.Date('1907-09-06'))
> weekdays(bdays)
tukey fisher cramer kendall
"Wednesday" "Monday" "Monday" "Friday"
> dtimes = c("2002-06-09 12:45:40","2003-01-29 09:30:40",
+ "2002-09-04 16:45:40","2002-11-13 20:00:40",
+ "2002-07-07 17:30:40")
> dtparts = t(as.data.frame(strsplit(dtimes,' ')))
> row.names(dtparts) = NULL
> thetimes = chron(dates=dtparts[,1],times=dtparts[,2],
+ format=c('y-m-d','h:m:s'))
> thetimes
[1] (02-06-09 12:45:40) (03-01-29 09:30:40) (02-09-04 16:45:40)
[4] (02-11-13 20:00:40) (02-07-07 17:30:40)
> dts = c("2005-10-21 18:47:22","2005-12-24 16:39:58",
+ "2005-10-28 07:30:05 PDT")
> as.POSIXlt(dts)
[1] "2005-10-21 18:47:22" "2005-12-24 16:39:58"
[3] "2005-10-28 07:30:05"
#unix时间戳转换成普通时间的方法:
> dts = c(1127056501,1104295502,1129233601,1113547501,
+ 1119826801,1132519502,1125298801,1113289201)
> mydates = dts
> class(mydates) = c('POSIXt','POSIXct')
> mydates
[1] "2005-09-18 08:15:01 PDT" "2004-12-28 20:45:02 PST"
[3] "2005-10-13 13:00:01 PDT" "2005-04-14 23:45:01 PDT"
[5] "2005-06-26 16:00:01 PDT" "2005-11-20 12:45:02 PST"
[7] "2005-08-29 00:00:01 PDT" "2005-04-12 00:00:01 PDT"> mydate = strptime('16/Oct/2005:07:51:00',format='%d/%b/%Y:%H:%M:%S')
[1] "2005-10-16 07:51:00"> ISOdate(2005,10,21,18,47,22,tz="PDT")
[1] "2005-10-21 18:47:22 PDT"> thedate = ISOdate(2005,10,21,18,47,22,tz="PDT")
> format(thedate,'%A, %B %d, %Y %H:%M:%S')
[1] "Friday, October 21, 2005 18:47:22"> mydate = as.POSIXlt('2005-4-19 7:01:00')
> names(mydate)
[1] "sec" "min" "hour" "mday" "mon" "year"
[7] "wday" "yday" "isdst"
> mydate$mday
[1] 19
参考资料:
【R笔记】日期处理的更多相关文章
- 【R笔记】R语言函数总结
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...
- R笔记(1):formula和Formula
#####开一个新的系列.关于R的一些笔记,就是遇到过的一些问题的简单整理.可能很基本,也可能没什么大的用处,作为一个记录而已.------------------------------------ ...
- R语言日期的表示和运算(详细总结)
1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed Oct 29 20:36: ...
- WP开发笔记——日期时间DateTime.Now函数
//2008年4月24日 System.DateTime.Now.ToString("D"); //2008-4-24 System.DateTime.Now.ToString(& ...
- MySQL 笔记 —— 日期和时间函数
[TOC] 获取当前日期的函数和获取当前时间的函数 CURDATE()和CURRENT_DATE()函数获取当前日期:CURTIME()和CURRENT_TIME()函数获取当前时间. mysql&g ...
- R笔记4:ggplot绘制商务图表--玫瑰图
我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图. Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 ...
- 【R笔记】使用R语言进行异常检测
本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局 ...
- 【R笔记】R的内存管理和垃圾清理
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm( ...
- 【R笔记】glm函数报错原因及解析
R语言glm函数学习: [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(for ...
随机推荐
- 关于JAVA正则匹配空白字符的问题(全角空格与半角空格)
今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件 显示“\u3000” ,这是什么? 这是全角空格!!! 查了一下 \s 不支持全角 1.& ...
- jw player笔记二----修改logo
一.修改HTML5模式下的logo 见http://blog.csdn.net/xiong_mao_1/article/details/17222757 二.修改FLASH模式下的logo IE7/8 ...
- nginx 设置client header 的大小与400错误
nginx默认的header长度上限是4k,如果超过了这个值 如果header头信息请求超过了,nginx会直接返回400错误可以通过以下2个参数来调整nginx的header上限 client_he ...
- 【BZOJ】ARC083 E - Bichrome Tree
[算法]树型DP [题意]给定含n个点的树的形态,和n个数字Xv,要求给每个点赋予黑色或白色和权值,满足对于每个点v,子树v中和v同色的点的权值和等于Xv.n<=10^5 [题解]首先每个点的权 ...
- react+redux基础用法
在学react的是,发现一旦我们封装好了我们的组件,那么我们的项目就跟搭积木一样简单快速,可是我们发现了一个问题,在一个页面往往会嵌套很多的组件,子组件必须要通过父组件传递参数才能渲染出数据,我们回想 ...
- 专业术语/Java专有名词
微服务 Web Service WebAPI(MicroSoft) RESTful RPC 微服务 服务拆分,利用轻量化机制(通常为HTTP源API)实现通信,复杂度可控,独立部署,技术选型灵活,容错 ...
- 会话Cookie
Cookie分为会话Cookie和本地Cookie两种 之前一直理解的是会话Cookie不在本地文件存储,只存储于内存,而本地Cookie因为设置了expire过期时间需要在本地存储 下面是白帽子讲W ...
- linux下检测可用串口并使用minicom打开(改进版)
之前使用的方式是这样的 http://www.cnblogs.com/zqb-all/p/7073612.html 这两天看到minicom的参数,可以直接使用 -D 指定设备,于是修改成了这样 建立 ...
- arm处理器中a5 a8 a9,v6 v7,arm7 arm9 arm11都是依据什么来分类的【转】
转自:http://blog.csdn.net/maochengtao/article/details/9951131ARM处理器发展这么多年,有很多架构,很多不同的内核 架构有armv1 v2 v3 ...
- phpstorm+xdebug详解
1.run->edit configurations StartUrl最好是网址,不然容易出错,Server选择的是配置时添加的Servers,详可参考:http://www.cnblogs.c ...
1、取出当前日期
Sys.Date()
[1] "2014-10-29"
date() #注意:这种方法返回的是字符串类型
[1] "Wed Oct 29 20:36:07 2014"
2、在R中日期实际是double类型,是从1970年1月1日以来的天数
typeof(Sys.Date())
[1] "double"
3、转换为日期
用as.Date()可以将一个字符串转换为日期值,默认格式是yyyy-mm-dd。
as.Date("2007-02-01") #得到"2007-02-01",显示为字符串,但实际是用double存储的
as.double(as.Date("1970-01-01")) #结果为0,是从1970年1月1日以来的天数。
可以把定制的日期字符串转换为日期型
as.Date("2007年2月1日", "%Y年%m月%d日")
[1] "2007-02-01"
格式 |
意义 |
%Y |
年份,以四位数字表示,2007 |
%m |
月份,以数字形式表示,从01到12 |
%d |
月份中当的天数,从01到31 |
%b |
月份,缩写,Feb |
%B |
月份,完整的月份名,指英文,February |
%y |
年份,以二位数字表示,07 |
4、把日期值输出为字符串
today <- Sys.Date()
format(today, "%Y年%m月%d日")
[1] "2014年10月29日"
5、计算日期差
由于日期内部是用double存储的天数,所以是可以相减的。
today <- Sys.Date()
gtd <- as.Date("2011-07-01") #我是从2011年7月开始实践Get Things Done(GTD)的
today - gtd
Time difference of 1216 days
原来我到今天为止已经实践GTD有1216天了。
用difftime()函数可以计算相关的秒数、分钟数、小时数、天数、周数
difftime(today, gtd, units="weeks") #还可以是“secs”, “mins”, “hours”, “days”
Time difference of 173.7143 weeks
案例1:绘图日期变化
继续用R语言解决一个我的实际问题:统计fitbit计步器中的数据并绘图
# 读入CSV格式的fitbit统计数据
fitbit <- read.csv("fitbit.csv")
# 日期要转换一下
fitbit$date <- as.Date(fitbit$date, "%Y年%m月%d日")
# 画图,只画线
plot(fitbit$date, fitbit$step, type="l")
# 只统计八月的运动情况
fitbit8 <- fitbit[months(fitbit$date)=="八月", ]
plot(fitbit8$date, fitbit8$step, type="l")
6、日期型数据
在R中自带的日期形式为:as.Date();以数值形式存储;
对于规则的格式,则不需要用format指定格式;如果输入的格式不规则,可以通过format指定的格式读入;
标准格式:
年-月-日或者年/月/日;如果不是以上二种格式,则会提供错误;
as.Date('23-2013-1')
错误于charTo按照Date(x) : 字符串的格式不够标准明确
> as.Date('23-2013-1',format='%d-%Y-%m')
[1] "2013-01-23"
格式 |
意义 |
%d |
月份中当的天数 |
%m |
月份,以数字形式表示 |
%b |
月份,缩写 |
%B |
月份,完整的月份名,指英文 |
%y |
年份,以二位数字表示 |
%Y |
年份,以四位数字表示 |
#其它日期相关函数
weekdays()取日期对象所处的周几;
months()取日期对象的月份;
quarters()取日期对象的季度;
#POSIX类
The POSIXct class stores date/time values as the number of seconds since January 1, 1970, while the POSIXlt class stores them as a list with elements for second, minute, hour, day, month, and year, among others.
POSIXct 是以1970年1月1号开始的以秒进行存储,如果是负数,则是1970年以前;正数则是1970年以后。(unix时间戳)
POSIXlt 是以列表的形式存储:年、月、日、时、分、秒;
mydate = as.POSIXlt(’2005-4-19 7:01:00’)
names(mydate)
默认情况下,日期之前是以/或者-进行分隔,而时间则以:进行分隔;
输入的标准格式为:日期 时间(日期与时间中间有空隔隔开)
时间的标准格式为:时:分 或者 时:分:秒;
如果输入的格式不是标准格式,则同样需要使用strptime函数,利用format来进行指定;
#生成案例数据
Dates <- c("2009-09-28","2010-01-15")
Times <- c( "23:12:55", "10:34:02")
charvec <- timeDate(paste(Dates, Times))
timeDate(charvec)
#取系统的时间
Sys.timeDate()
#一个月的第一天
timeFirstDayInMonth()
#一个月的最后一天
timeLastDayInMonth()
#一周当中第几天
dayOfWeek()
#一年当中的第几天
dayOfYear()
7、unix时间戳转换成普通时间的方法
Sys.Date( ) returns today's date.
date() returns the current date and time.
# print today's date
today <-Sys.Date()
format(today, format="%B %d %Y")
"June 20 2007" # convert date info in format 'mm/dd/yyyy'
strDates <- c("01/05/1965", "08/16/1975")
dates <- as.Date(strDates, "%m/%d/%Y") # convert dates to character data
strDates <- as.character(dates) --------------------------------------
> as.Date('1915-6-16')
[1] "1915-06-16"
> as.Date('1990/02/17')
[1] "1990-02-17" > as.Date('1/15/2001',format='%m/%d/%Y')
[1] "2001-01-15"
> as.Date('April 26, 2001',format='%B %d, %Y')
[1] "2001-04-26"
> as.Date('22JUN01',format='%d%b%y') # %y is system-specific; use with caution
[1] "2001-06-22" > bdays = c(tukey=as.Date('1915-06-16'),fisher=as.Date('1890-02-17'),
+ cramer=as.Date('1893-09-25'), kendall=as.Date('1907-09-06'))
> weekdays(bdays)
tukey fisher cramer kendall
"Wednesday" "Monday" "Monday" "Friday" > dtimes = c("2002-06-09 12:45:40","2003-01-29 09:30:40",
+ "2002-09-04 16:45:40","2002-11-13 20:00:40",
+ "2002-07-07 17:30:40")
> dtparts = t(as.data.frame(strsplit(dtimes,' ')))
> row.names(dtparts) = NULL
> thetimes = chron(dates=dtparts[,1],times=dtparts[,2],
+ format=c('y-m-d','h:m:s'))
> thetimes
[1] (02-06-09 12:45:40) (03-01-29 09:30:40) (02-09-04 16:45:40)
[4] (02-11-13 20:00:40) (02-07-07 17:30:40) > dts = c("2005-10-21 18:47:22","2005-12-24 16:39:58",
+ "2005-10-28 07:30:05 PDT")
> as.POSIXlt(dts)
[1] "2005-10-21 18:47:22" "2005-12-24 16:39:58"
[3] "2005-10-28 07:30:05"
#unix时间戳转换成普通时间的方法:> dts = c(1127056501,1104295502,1129233601,1113547501,
+ 1119826801,1132519502,1125298801,1113289201)
> mydates = dts
> class(mydates) = c('POSIXt','POSIXct')
> mydates
[1] "2005-09-18 08:15:01 PDT" "2004-12-28 20:45:02 PST"
[3] "2005-10-13 13:00:01 PDT" "2005-04-14 23:45:01 PDT"
[5] "2005-06-26 16:00:01 PDT" "2005-11-20 12:45:02 PST"
[7] "2005-08-29 00:00:01 PDT" "2005-04-12 00:00:01 PDT"> mydate = strptime('16/Oct/2005:07:51:00',format='%d/%b/%Y:%H:%M:%S')
[1] "2005-10-16 07:51:00"> ISOdate(2005,10,21,18,47,22,tz="PDT")
[1] "2005-10-21 18:47:22 PDT"> thedate = ISOdate(2005,10,21,18,47,22,tz="PDT")
> format(thedate,'%A, %B %d, %Y %H:%M:%S')
[1] "Friday, October 21, 2005 18:47:22"> mydate = as.POSIXlt('2005-4-19 7:01:00')
> names(mydate)
[1] "sec" "min" "hour" "mday" "mon" "year"
[7] "wday" "yday" "isdst"
> mydate$mday
[1] 19
参考资料:
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...
#####开一个新的系列.关于R的一些笔记,就是遇到过的一些问题的简单整理.可能很基本,也可能没什么大的用处,作为一个记录而已.------------------------------------ ...
1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed Oct 29 20:36: ...
//2008年4月24日 System.DateTime.Now.ToString("D"); //2008-4-24 System.DateTime.Now.ToString(& ...
[TOC] 获取当前日期的函数和获取当前时间的函数 CURDATE()和CURRENT_DATE()函数获取当前日期:CURTIME()和CURRENT_TIME()函数获取当前时间. mysql&g ...
我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图. Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 ...
本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局 ...
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm( ...
R语言glm函数学习: [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(for ...
今天遇到一个字符串,怎么匹配空格都不成功!!! 我把空格复制到test.properties文件 显示“\u3000” ,这是什么? 这是全角空格!!! 查了一下 \s 不支持全角 1.& ...
一.修改HTML5模式下的logo 见http://blog.csdn.net/xiong_mao_1/article/details/17222757 二.修改FLASH模式下的logo IE7/8 ...
nginx默认的header长度上限是4k,如果超过了这个值 如果header头信息请求超过了,nginx会直接返回400错误可以通过以下2个参数来调整nginx的header上限 client_he ...
[算法]树型DP [题意]给定含n个点的树的形态,和n个数字Xv,要求给每个点赋予黑色或白色和权值,满足对于每个点v,子树v中和v同色的点的权值和等于Xv.n<=10^5 [题解]首先每个点的权 ...
在学react的是,发现一旦我们封装好了我们的组件,那么我们的项目就跟搭积木一样简单快速,可是我们发现了一个问题,在一个页面往往会嵌套很多的组件,子组件必须要通过父组件传递参数才能渲染出数据,我们回想 ...
微服务 Web Service WebAPI(MicroSoft) RESTful RPC 微服务 服务拆分,利用轻量化机制(通常为HTTP源API)实现通信,复杂度可控,独立部署,技术选型灵活,容错 ...
Cookie分为会话Cookie和本地Cookie两种 之前一直理解的是会话Cookie不在本地文件存储,只存储于内存,而本地Cookie因为设置了expire过期时间需要在本地存储 下面是白帽子讲W ...
之前使用的方式是这样的 http://www.cnblogs.com/zqb-all/p/7073612.html 这两天看到minicom的参数,可以直接使用 -D 指定设备,于是修改成了这样 建立 ...
转自:http://blog.csdn.net/maochengtao/article/details/9951131ARM处理器发展这么多年,有很多架构,很多不同的内核 架构有armv1 v2 v3 ...
1.run->edit configurations StartUrl最好是网址,不然容易出错,Server选择的是配置时添加的Servers,详可参考:http://www.cnblogs.c ...