pandas-13 时间序列操作方法pd.date_range()

在pandas中拥有强大的时间序列操作方法。

使用 pd.date_range() 生成 ‘pandas.core.indexes.datetimes.DatetimeIndex’ 对象。

直接上demo：

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

from datetime import datetime

np.random.seed(666)

# 生成时间对象

t1 = datetime(2009, 10, 1)

print(type(t1)) # 2009-10-01 00:00:00 type:<class 'datetime.datetime'>

date_list = [

    datetime(2018, 10, 1),

    datetime(2018, 10, 10),

    datetime(2019, 10, 1),

    datetime(2019, 10, 20),

    datetime(2019, 11, 1)

]

print(date_list)

# [datetime.datetime(2018, 10, 1, 0, 0), datetime.datetime(2018, 10, 10, 0, 0), datetime.datetime(2019, 10, 1, 0, 0), datetime.datetime(2019, 10, 20, 0, 0), datetime.datetime(2019, 11, 1, 0, 0)]

s1 = Series(np.random.rand(5), index=date_list)

print(s1) # index 是 时间 对象

'''

2018-10-01    0.700437

2018-10-10    0.844187

2019-10-01    0.676514

2019-10-20    0.727858

2019-11-01    0.951458

dtype: float64

'''

# 直接按照索引进行访问

print(s1[3]) # 0.7278580572480748

# 传入时间对象访问

print(s1[datetime(2019, 10, 20)]) # 0.7278580572480748

# 传入字符串

print(s1['2019-10-20']) # 0.7278580572480748

# 传入字符串2

print(s1['20191020']) # 0.7278580572480748

# 单纯写 年 月， 可以得到该年月下的所有内容

print(s1['2019-10'])

'''

2019-10-01    0.676514

2019-10-20    0.727858

dtype: float64

'''

# 原理同上

print(s1['2019'])

'''

2019-10-01    0.676514

2019-10-20    0.727858

2019-11-01    0.951458

dtype: float64

'''

# date_range() 参数 start 开始时间， periods 间隔时间，freq 按照什么间隔 d w 5h……

date_list_new = pd.date_range(start='2018-01-1', periods=50, freq='w')

print(type(date_list_new), date_list_new) # <class 'pandas.core.indexes.datetimes.DatetimeIndex'>

''' 一周 默认 从 周日 开始的， 如果需要更改，可以改变 freq='w-mon'

DatetimeIndex(['2018-01-07', '2018-01-14', '2018-01-21', '2018-01-28',

               '2018-02-04', '2018-02-11', '2018-02-18', '2018-02-25',

               '2018-03-04', '2018-03-11', '2018-03-18', '2018-03-25',

               '2018-04-01', '2018-04-08', '2018-04-15', '2018-04-22',

               '2018-04-29', '2018-05-06', '2018-05-13', '2018-05-20',

               '2018-05-27', '2018-06-03', '2018-06-10', '2018-06-17',

               '2018-06-24', '2018-07-01', '2018-07-08', '2018-07-15',

               '2018-07-22', '2018-07-29', '2018-08-05', '2018-08-12',

               '2018-08-19', '2018-08-26', '2018-09-02', '2018-09-09',

               '2018-09-16', '2018-09-23', '2018-09-30', '2018-10-07',

               '2018-10-14', '2018-10-21', '2018-10-28', '2018-11-04',

               '2018-11-11', '2018-11-18', '2018-11-25', '2018-12-02',

               '2018-12-09', '2018-12-16'],

              dtype='datetime64[ns]', freq='W-SUN')

'''

t_range = pd.date_range('2018-1-1', '2018-12-31')

print(t_range)

'''

DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04',

               '2018-01-05', '2018-01-06', '2018-01-07', '2018-01-08',

               '2018-01-09', '2018-01-10',

               ...

               '2018-12-22', '2018-12-23', '2018-12-24', '2018-12-25',

               '2018-12-26', '2018-12-27', '2018-12-28', '2018-12-29',

               '2018-12-30', '2018-12-31'],

              dtype='datetime64[ns]', length=365, freq='D')

'''

s1 = Series(np.random.randn(len(t_range)), index=t_range)

print(s1)

# 按照每月采样

# 可以求每个月的平均值，然后生成一个series

print(s1['2018-1'].mean()) # -0.03690388489355985

# 但是有更简单的方法

s1_month = s1.resample('M').mean()

print(s1_month)

'''

2018-01-31   -0.036904

2018-02-28   -0.044257

2018-03-31    0.037668

2018-04-30    0.124246

2018-05-31   -0.119733

2018-06-30    0.214724

2018-07-31   -0.123569

2018-08-31    0.180736

2018-09-30   -0.113882

2018-10-31   -0.111971

2018-11-30   -0.232061

2018-12-31    0.214558

Freq: M, dtype: float64

'''

print(s1.resample('H').ffill()) # 按小时采样，使用向前填充的方法

print(s1.resample('H').bfill()) # 向后填充

pandas-13 时间序列操作方法pd.date_range()的更多相关文章

pandas处理时间序列（2）：DatetimeIndex、索引和选择、含有重复索引的时间序列、日期范围与频率和移位、时间区间和区间算术
一.时间序列基础 1. 时间戳索引DatetimeIndex 生成20个DatetimeIndex from datetime import datetime dates = pd.date_rang ...
pandas处理时间序列（1）：pd.Timestamp()、pd.Timedelta()、pd.datetime( )、 pd.Period()、pd.to_timestamp()、datetime.strftime()、pd.to_datetime( )、pd.to_period()
Pandas库是处理时间序列的利器,pandas有着强大的日期数据处理功能,可以按日期筛选数据.按日期显示数据.按日期统计数据. pandas的实际类型主要分为: timestamp(时间戳) ...
03. Pandas 2| 时间序列
1.时间模块:datetime datetime模块,主要掌握:datetime.date(), datetime.datetime(), datetime.timedelta() 日期解析方法:pa ...
pandas处理时间序列（3）：重采样与频率转换
五.重采样与频率转换 1. resample方法 rng = pd.date_range('1/3/2019',periods=1000,freq='D') rng 2. 降采样 (1)resampl ...
pandas之时间序列
Pandas中提供了许多用来处理时间格式文本的方法,包括按不同方法生成一个时间序列,修改时间的格式,重采样等等. 按不同的方法生成时间序列 In [7]: import pandas as pd # ...
pandas 之时间序列索引
import numpy as np import pandas as pd 引入 A basic kind of time series object in pandas is a Series i ...
pandas之时间序列笔记
时间戳tiimestamp:固定的时刻->pd.Timestamp 固定时期period:比如2016年3月份,再如2015年销售额->pd.Period 时间间隔interval:由起始 ...
pandas之时间序列(data_range)、重采样(resample)、重组时间序列(PeriodIndex)
1.data_range生成时间范围 a) pd.date_range(start=None, end=None, periods=None, freq='D') start和end以及freq配合能 ...
笔记 | pandas之时间序列学习随笔1
1. 时间序列自动生成 ts = pd.Series(np.arange(1, 901), index=pd.date_range('2010-1-1', periods=900)) 最终生成了从20 ...

随机推荐

Mac OSX下增加TCP连接数
查看 max files: $ sysctl -a | grep files kern.maxfiles = 12288 kern.maxfilesperproc = 10240 修改: $ sudo ...
js判断字符串是否以指定字符串开头或是否包含指定字符串
1. 用js判断一个字符串是否是以某个子字符串开头如:ssss001是否以ssss开头, 可以这样做: 1 2 3 4 5 6 var fdStart = strCode.indexOf(" ...
xshell如何导入.xsh 文件
xshell 不能导入 xsh 文件导入功能只能导入 *.xts, *.csv, *.tsv 文件,不能直接导入 .xsh 其实 xsh文件不需要导入,直接拷贝进去就可以了(.xsh 本来就是 x ...
CentOS7 增加回环地址
添加回环地址的命令和说明如下: #添加一个回环地址到lo网卡,添加多个可以改lo:后边的序号 [要添加的地址] netmask 255.255.255.255 broadcast [要添加的地址] # ...
【Python】解析Python中类的使用
目录结构: contents structure [-] 类的基本使用专有方法继承单重继承多重继承砖石继承 1.类的基本使用下面是类使用的一个简单案例, class person: &qu ...
查找算法(3)--Interpolation search--插值查找
1. 插值查找 (1)说明在介绍插值查找之前,首先考虑一个新问题,为什么上述算法一定要是折半,而不是折四分之一或者折更多呢? 打个比方,在英文字典里面查“apple”,你下意识翻开字典是翻前面的书页 ...
[整理] linux ubuntu 服务器键盘设置错误完美解决
根据原文来源:https://blog.csdn.net/mingjie1212/article/details/48525095 进行修改. 使用命令 dpkg-reconfigure keybo ...
k8s记录-kubeam部署
#配置源[kubernetes] name=kubernetes repo baseurl=http://mirrors.aliyun.com/kubernetes/yum/repos/kuberne ...
Linux（CentOS）启动时自动执行脚本（rc.local）
一.Linux开机启动有多种方法,比如我设置mysql开机启动为:chkconfig --level 35 mysqld on 二.下面说说通过rc.local文件进行开机启动: 1.首先创建一个启动 ...
JKS转PFX
通过jks2pfx工具请下载:JKS2PFX转换工具. 将压缩包解开到 c:\jks2pfx 目录下, 运行以下命令:JKS2PFX <导出文件名> [Java Runtime的目录]备 ...

pandas-13 时间序列操作方法pd.date_range()

pandas-13 时间序列操作方法pd.date_range()

pandas-13 时间序列操作方法pd.date_range()的更多相关文章

随机推荐

热门专题