pandas之时间序列

Pandas中提供了许多用来处理时间格式文本的方法，包括按不同方法生成一个时间序列，修改时间的格式，重采样等等。

按不同的方法生成时间序列

In [7]: import pandas as pd

# 按起始和终止日期以及步长生成时间序列

In [8]: pd.date_range(start="20171212",end="20180101",freq="D")

Out[8]:

DatetimeIndex(['2017-12-12', '2017-12-13', '2017-12-14', '2017-12-15',

               '2017-12-16', '2017-12-17', '2017-12-18', '2017-12-19',

               '2017-12-20', '2017-12-21', '2017-12-22', '2017-12-23',

               '2017-12-24', '2017-12-25', '2017-12-26', '2017-12-27',

               '2017-12-28', '2017-12-29', '2017-12-30', '2017-12-31',

               '2018-01-01'],

              dtype='datetime64[ns]', freq='D')

In [9]: pd.date_range(start="20171212",end="20180101",freq="10D")

Out[9]: DatetimeIndex(['2017-12-12', '2017-12-22', '2018-01-01'], dtype='datetime64[ns]', freq='10D')

# 按起始日期，数量和步长生成时间序列

In [10]: pd.date_range(start="20171212",periods=10,freq="10D")

Out[10]:

DatetimeIndex(['2017-12-12', '2017-12-22', '2018-01-01', '2018-01-11',

               '2018-01-21', '2018-01-31', '2018-02-10', '2018-02-20',

               '2018-03-02', '2018-03-12'],

              dtype='datetime64[ns]', freq='10D')

In [11]: pd.date_range(start="20171212",periods=10,freq="M")

Out[11]:

DatetimeIndex(['2017-12-31', '2018-01-31', '2018-02-28', '2018-03-31',

               '2018-04-30', '2018-05-31', '2018-06-30', '2018-07-31',

               '2018-08-31', '2018-09-30'],

              dtype='datetime64[ns]', freq='M')

# 如果取不到最后一天，这个时间序列就会停止在前一个生成的日期处

In [12]: pd.date_range(start="20171212",end="20180105",freq="10D")

Out[12]: DatetimeIndex(['2017-12-12', '2017-12-22', '2018-01-01'], dtype='datetime64[ns]', freq='10D')

案例

假如我们现在有美国2015年12月到2017年9月的911求救电话信息。（数据来源：Emergency - 911 Calls）假如我们需要统计并绘制每个月的各类求救电话的变化情况，应该怎么做呢？

# coding=utf-8

import pandas as pd

from matplotlib import pyplot as plt

from matplotlib import font_manager

filepath = "./911.csv"

df = pd.read_csv(filepath)

font = font_manager.FontProperties(fname="C:\Windows\Fonts\msyh.ttc")

df["timeStamp"] = pd.to_datetime(df["timeStamp"])

df.set_index("timeStamp", inplace=True)

temp_list = df["title"].str.split(":")

cate_list = [i[0] for i in temp_list]

df["cate"] = cate_list

plt.figure(figsize=(20, 8), dpi=80)

# 分组

for group_name, group_data in df.groupby(by="cate"):

    # 对不同分类进行绘图

    count_by_month = group_data.resample("M").count()["title"]

    _x = count_by_month.index

    _y = count_by_month.values

    plt.plot(range(len(_x)), _y, label=group_name)

_x = _x.strftime("%Y-%m")

plt.xticks(range(len(_x)), _x, rotation=45)

plt.legend(loc="best")

plt.show()

结果如图：

pandas之时间序列的更多相关文章

pandas处理时间序列（4）: 移动窗口函数
六.移动窗口函数移动窗口和指数加权函数类别如↓: rolling_mean 移动窗口的均值 pandas.rolling_mean(arg, window, min_periods=None, fr ...
pandas处理时间序列（3）：重采样与频率转换
五.重采样与频率转换 1. resample方法 rng = pd.date_range('1/3/2019',periods=1000,freq='D') rng 2. 降采样 (1)resampl ...
03. Pandas 2| 时间序列
1.时间模块:datetime datetime模块,主要掌握:datetime.date(), datetime.datetime(), datetime.timedelta() 日期解析方法:pa ...
pandas处理时间序列（2）：DatetimeIndex、索引和选择、含有重复索引的时间序列、日期范围与频率和移位、时间区间和区间算术
一.时间序列基础 1. 时间戳索引DatetimeIndex 生成20个DatetimeIndex from datetime import datetime dates = pd.date_rang ...
pandas处理时间序列（1）：pd.Timestamp()、pd.Timedelta()、pd.datetime( )、 pd.Period()、pd.to_timestamp()、datetime.strftime()、pd.to_datetime( )、pd.to_period()
Pandas库是处理时间序列的利器,pandas有着强大的日期数据处理功能,可以按日期筛选数据.按日期显示数据.按日期统计数据. pandas的实际类型主要分为: timestamp(时间戳) ...
pandas 之时间序列索引
import numpy as np import pandas as pd 引入 A basic kind of time series object in pandas is a Series i ...
pandas之时间序列(data_range)、重采样(resample)、重组时间序列(PeriodIndex)
1.data_range生成时间范围 a) pd.date_range(start=None, end=None, periods=None, freq='D') start和end以及freq配合能 ...
pandas之时间序列笔记
时间戳tiimestamp:固定的时刻->pd.Timestamp 固定时期period:比如2016年3月份,再如2015年销售额->pd.Period 时间间隔interval:由起始 ...
笔记 | pandas之时间序列学习随笔1
1. 时间序列自动生成 ts = pd.Series(np.arange(1, 901), index=pd.date_range('2010-1-1', periods=900)) 最终生成了从20 ...

随机推荐

vue里的v-show和v-if
v-show:false 对应的是display:none:不移除dom元素.对网页渲染性能更好,适应于频繁的操作该dom的显示隐藏. v-if: false 对应 ...
vue里computed的get和set
computed里的对象有get和set方法. get是当该对象所依赖的变量发生变化是执行,重新returncomputed结果. set是该对象的值变化时会执行,并且将变化的结果作为参数传进set里 ...
react-redux简单实用
首先了解一个过程,redux 肯定是通过在组件中出发一个方法(事件),我们可以实现一个简单的例子播放和停止播放(写到这今日心情不好,下次继续) redux需要安装以下依赖:cnpm install ...
Excel GET.CELL说明
GET是得到的意思CELL是单元格的意思 --->那么它的意思就是你想得到单元格的什么东西(信息) 函数定义: GET.CELL(类型号,单元格(或范围)) 其中类型号,即你想要得到的信 ...
ELK之安装searchguard后默认管理员用户admin修改
安装完elasticsearch之后会有一个默认的用户admin密码也为admin,该用户无法删除无法编辑修改密码,用于生产时安全性较差,需要修改默认密码或者删除该admin用户使用工具生产加密密码 ...
浅谈Vue 项目性能优化经验
我优化公司的项目总结的几点: 1.先查看引入的图片大小,如果太大了,可以压缩,压缩路径:https://zhitu.isux.us/ 2.代码包优化, 待下项目开发完成.进行打包源码上线环节,需要对项 ...
nginx入门与实战安装启动配置nginx Nginx状态信息（status）配置正向代理反向代理 nginx语法之location详解
nginx入门与实战网站服务想必我们大多数人都是通过访问网站而开始接触互联网的吧.我们平时访问的网站服务就是 Web 网络服务,一般是指允许用户通过浏览器访问到互联网中各种资源的服务. Web ...
Linux中找到占用cpu最高的线程
在工作中,经常会碰到CPU占用100%的情况,那如何找到是那个线程占用了cpu呢? 1. top命令,找到cpu占用最高的进程 2. 查看该进程的线程, top -p <pid> 3. ...
jquery基础学习之AJAX篇（五）
理解不深,只知道这么用 jquery 中ajax的请求方法 $.ajax({ url:‘http://...’, //请求网址 type:'GET', //请求方法 success:function( ...
JDK8新增接口的默认方法与静态方法
JDK8之前,interface中可以定义常量和抽象方法,访问修饰符是public. public interface A { /** a1和a2写法是等价的 */ public static fin ...

pandas之时间序列

按不同的方法生成时间序列

案例

pandas之时间序列的更多相关文章

随机推荐

热门专题