Pandas库是处理时间序列的利器，pandas有着强大的日期数据处理功能，可以按日期筛选数据、按日期显示数据、按日期统计数据。

pandas的实际类型主要分为：

timestamp（时间戳）
period（时期）
timedelta（时间间隔）

常用的日期处理函数有：

pd.to_datetime()
pd.to_period()
pd.date_range()
pd.period_range
resample

一、定义时间格式

1. pd.Timestamp()、pd.Timedelta()

（1）Timestamp时间戳

#定义timestamp

t1=pd.Timestamp('2019-01-10')

t2=pd.Timestamp('2018-12-10')

print(f't1= {t1}')

print(f't2= {t2}')

print(f't1与t2时间间隔：{(t1-t2).days}天')

#获取当前时间

now=pd.datetime.now()

print(now)

print(now.strftime('%Y-%m-%d'))

（2）Timedelta：实现datetime加减

对日期和时间进行加减实际上就是把datetime往后或往前计算，得到新的datetime。加减可以直接用+和-运算符，不过需要导入timedelta这个类：

#时间间隔

pd.Timedelta(days=5, minutes=50, seconds=20, milliseconds=10, microseconds=10, nanoseconds=10)

#计算当前时间往后100天的日期

dt=now+pd.Timedelta(days=100)

#只显示年月日

dt.strftime('%Y-%m-%d')

2. pd.Period()

#定义时期period，默认是A-DEC，代表年份，以12月作为最后一个月

p1=pd.Period('2019')

p2=pd.Period('2018')

print(f'p1={p1}年')

print(f'p2={p2}年')

print(f'p1和p2间隔{p1-p2}年')

#可以直接+、-整数（代表年）

print(f'十年前是{p1-10}年')

#通过asfreq转换时期频率

#以第一个月算,p1前面已赋值为2019年

p1.asfreq('M','start')

#以最后一个月算

p1.asfreq('M','end')

#财报季度

p=pd.Period('2019Q3',freq='Q-DEC')

#起始月日

print(p.asfreq('D','start'))

#结束月日

print(p.asfreq('D','end'))

3. pd.to_timestamp()

时期转为时间戳

#时间戳和时期相互转换

print(p1.to_timestamp(how='end'))

print(p1.to_timestamp(how='start'))

4. pd.to_period()

时间戳转为时期

#t1前面赋值为'2019-1-10'

#转换为月时期

print(t1.to_period('M'))

#转换为日时期

print(t1.to_period('D'))

print(t1.to_period('W'))

5. pd.to_datetime()

pandas.to_datetime（arg，errors ='raise'，utc = None，format = None，unit = None ）

（1）获取指定的时间和日期

当数据很多，且日期格式不标准时的时候，可以使用to_datetime，将DataFrame中的时间转换成统一标准。

例如：df[''date]数据类型为“object”，通过pd.to_datetime将该列数据转换为时间类型，即datetime。

df['date_formatted']=pd.to_datetime(df['date'],format='%Y-%m-%d')

常用时间：

（2）to_datetime可以处理那些被认为是缺失值的值(None、空字符串)

（3）将Str和Unicode转化为时间格式

6. strptime和strftime

（1）字符串转换成datetime格式: strptime

用户输入的日期和时间是字符串，要处理日期和时间，首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现，需要一个日期和时间的格式化字符串：

df_data1  = pd.DataFrame(columns=['date','values'])

df_data1['date'] = ['2019-01-01','2019-01-02','2019-01-03','2019-01-04','2019-01-05']

df_data1['values'] = np.random.randn(5)

df_data1

df_data1['date'] = df_data1['date'].map(lambda x:datetime.strptime(x,'%Y-%m-%d'))

df_data1

注意转换后的datetime是没有时区信息的。

举例：将分开的年月日时整合，并设置为索引

数据集：

from datetime import datetime

# load data

def parse(x):

    return datetime.strptime(x, '%Y %m %d %H')

dataset = read_csv('raw.csv',  parse_dates = [['year', 'month', 'day', 'hour']], index_col=0, date_parser=parse)

dataset.drop('No', axis=1, inplace=True)

# manually specify column names

dataset.columns = ['pollution', 'dew', 'temp', 'press', 'wnd_dir', 'wnd_spd', 'snow', 'rain']

dataset.index.name = 'date'

（2）datetime变回string格式: strftime

如果已经有了datetime对象，要把它格式化为字符串显示给用户，就需要转换为str，转换方法是通过strftime()实现的，同样需要一个日期和时间的格式化字符串：

#定义一个DataFrame格式的数据df_data

df_data  = pd.DataFrame(columns=['date','values'])

df_data['date'] = pd.date_range('2019/01/01',periods=5)

df_data['values'] = np.random.randn(5)

df_data

用strftime把datetime格式的时间数据转换成string

df_data['date'] = df_data['date'].apply(lambda x:x.strftime('%Y/%m')) #datetime格式转成str

以下是时间格式定义

代码  说明

%Y  4位数的年

%y  2位数的年

%m  2位数的月[01,12]

%d  2位数的日[01，31]

%H  时（24小时制）[00,23]

%l  时（12小时制）[01,12]

%M  2位数的分[00,59]

%S  秒[00,61]有闰秒的存在

%w  用整数表示的星期几[0（星期天），6]

%F  %Y-%m-%d简写形式例如，2017-06-27

%D  %m/%d/%y简写形式

参考文献：

【1】python的时间转换datetime和pd.to_datetime

【2】pandas.to_datetime

pandas处理时间序列（1）：pd.Timestamp()、pd.Timedelta()、pd.datetime( )、 pd.Period()、pd.to_timestamp()、datetime.strftime()、pd.to_datetime( )、pd.to_period()的更多相关文章

03. Pandas 2| 时间序列
1.时间模块:datetime datetime模块,主要掌握:datetime.date(), datetime.datetime(), datetime.timedelta() 日期解析方法:pa ...
pandas处理时间序列（2）：DatetimeIndex、索引和选择、含有重复索引的时间序列、日期范围与频率和移位、时间区间和区间算术
一.时间序列基础 1. 时间戳索引DatetimeIndex 生成20个DatetimeIndex from datetime import datetime dates = pd.date_rang ...
pandas之时间序列笔记
时间戳tiimestamp:固定的时刻->pd.Timestamp 固定时期period:比如2016年3月份,再如2015年销售额->pd.Period 时间间隔interval:由起始 ...
对pandas和pendulum的吐槽——TimeStamp numpy的datetime64的转型问题
今天被这俩货因为时间日期处理不兼容的问题折腾半天,气死人,不吐槽不行了! 这俩简称都可以是pd的库,都TM够轴的,互相兼容极差. pandas 和 pendulum 知名度都很高,也很常用.但我就是用 ...
timestamp与timedelta，管理信息系统概念与基础
1.将字符串‘2017年10月9日星期一9时10分0秒 UTC+8:00’转换为timestamp. 2.100天前是几号? 今年还有多少天? #timestamp与timedelta from ...
pandas之时间序列
Pandas中提供了许多用来处理时间格式文本的方法,包括按不同方法生成一个时间序列,修改时间的格式,重采样等等. 按不同的方法生成时间序列 In [7]: import pandas as pd # ...
pandas 之时间序列索引
import numpy as np import pandas as pd 引入 A basic kind of time series object in pandas is a Series i ...
pandas之时间序列(data_range)、重采样(resample)、重组时间序列(PeriodIndex)
1.data_range生成时间范围 a) pd.date_range(start=None, end=None, periods=None, freq='D') start和end以及freq配合能 ...
pandas处理时间序列（4）: 移动窗口函数
六.移动窗口函数移动窗口和指数加权函数类别如↓: rolling_mean 移动窗口的均值 pandas.rolling_mean(arg, window, min_periods=None, fr ...

随机推荐

NO.5 算法测试（词条统计）
一.安装Eclipse 下载Eclipse,解压安装,例如安装到/usr/local,即/usr/local/eclipse 4.3.1版本下载地址:http://pan.baidu.com/s/1 ...
libGDX开发环境搭建-Android Studio 最新版
http://blog.csdn.net/renwuqiangg/article/details/53088720 —————————————————————————————————————————— ...
sql日期格式小应用记录一下
比如这样的数据 20170317 要转成2017-03-17 单独一步做不到两步思想先转成日期格式在进行格式化 select CONVERT(varchar(10),(CAST(CONVERT( ...
oozie调度sqoop Job 数据库密码无法保存
问题描述通过oozie调度sqoop作业时,需要输入数据库作业密码,但在sqoop元数据服务配置密码后,过一段时间会失效. 解决方法将数据库密码写入HDFS文件,通过配置Sqoop job,实现传 ...
windows 安装python pip Could not install packages due to anEnvironmentError: [WinError 5] 拒绝访问
找打 C:\Windows\System32 文件夹下面的cmd.exe点开后运行python -m pip install --upgrade pip 即解决问题了.
rabbitmq消费端加入精确控频。
控制频率之前用的是线程池的数量来控制,很难控制.因为做一键事情,做一万次,并不是每次消耗的时间都相同,所以很难推测出到底多少线程并发才刚好不超过指定的频率. 现在在框架中加入控频功能,即使开200线程 ...
【Dubbo 源码解析】06_Dubbo 服务调用
Dubbo 服务调用根据上图,可以看出,服务调用过程为: Consumer 端的 Proxy 调用 Cluster 层选择集群中的某一个 Invoker(负载均衡) Invoker 最终会调用 Pr ...
makefile 常用函数
Linux下编译c/c++源码需要编写makefile文件,文章参看 http://blog.sina.com.cn/s/blog_4c4d6e74010009jr.html 一函数的调用语法二字符 ...
Nessus中文报告自动化脚本
前言 Nessus扫描完成,总要花挺多时间去整理报告,为此写了一个小脚本,用于自动化生成中文漏洞报告. 解析导出的html报告,自动翻译成中文,并提供修复建议,减少整理报告的时间,提升工作效率. gi ...
[原]Jenkins(二十一) jenkins再出发Build periodically和Poll SCM
缘由: 使用jenkins的目的需要固定时间构建和间隔固定时间构建,所以才会用到这两个功能. 位置:这两个功能的位置位于每个job的config项中,如下图: [重要的注意点:] ...

pandas处理时间序列（1）：pd.Timestamp()、pd.Timedelta()、pd.datetime( )、 pd.Period()、pd.to_timestamp()、datetime.strftime()、pd.to_datetime( )、pd.to_period()