matplotlib + pandas绘图
利用pandas处理日期数据,并根据日期绘制增长率曲线。
处理的json文本内容如下:
# pd.json [
{"name": "A", "date": "注册于 2011-6-9"},
{"name": "B", "date": "注册于 2011-6-23"},
{"name": "C", "date": "注册于 2011-7-2"},
{"name": "D", "date": "注册于 2011-10-3"},
{"name": "E", "date": "注册于 2011-8-23"},
{"name": "F", "date": "注册于 2011-9-2"},
{"name": "G", "date": "注册于 2011-10-3"},
{"name": "H", "date": "注册于 2011-11-23"},
{"name": "I", "date": "注册于 2011-12-2"},
{"name": "J", "date": "注册于 2011-12-3"},
{"name": "K", "date": "注册于 2011-12-23"},
{"name": "L", "date": "注册于 2011-10-2"},
{"name": "M", "date": "注册于 2011-8-3"},
{"name": "Y", "date": "注册于 2011-12-23"},
{"name": "U", "date": "注册于 2011-10-9"},
{"name": "W", "date": "注册于 2011-8-6"},
{"name": "K", "date": "注册于 2011-12-21"},
{"name": "L", "date": "注册于 2011-12-5"},
{"name": "M", "date": "注册于 2011-8-3"},
{"name": "Y", "date": "注册于 2011-12-23"},
{"name": "U", "date": "注册于 2011-10-9"},
{"name": "W", "date": "注册于 2011-12-6"}
]
1. 读取json文件的数据(对于自己构建的json文件,里面的键值对字符串必须是双引号)
dt = pd.read_json('pd.json', orient='records', encoding='utf-8')
顺便说一下 orient 参数:不一样的文件内容格式,这个参数的值是不一样的,不然会读取失败。
'split' : 索引,列字段,和数据
如: '{"index": [1, 2, 3], "columns": ["a", "b"], "data": [[1, 4], [2, 5], [3, 6]]}'
'records' : 元素为字典的列表
如: '[{"a": 1}, {"b": 2}, {"c": 3}]'
'index' : 索引为键, 值为键值对
如: '{"0": {"a": 3, "b": 5}, "1": {"a": 7, "b": 9}}'
'columns' : 索引为键,值为键值对(注意:输出的数据行列与'index'的不一样)
如: '{"a": {"2": 3, "4": 5}, "b": {"6": 7, "8": 9}}',结果与index的例子相同
'values' : 两层的嵌套列表
如: '[["a": 1], ["b": 2]]'
2. 处理日期
# 正则表达式处理
patt = r'(\d{4}-\d{1,2})' # 匹配到月份,也可以匹配到日,再加上 '-\d{1,2}'即可
dt['date'] = dt['date'].str.extract(patt, expand=True)
# 把字符串格式转换为日期格式
dt['date'] = pd.to_datetime(dt['date']) # 由于只匹配到月份,to_datetime函数默认日为 01,
此时输出 dt 为:
0 2011-06-01 A
1 2011-06-01 B
2 2011-07-01 C
.....
3. 新增一列 cnt 来统计相同月份的个数,并按日期排序
dl = dt.groupby(['date'], as_index=False)['date'].agg({'cnt': 'count'}).sort_values(by='date')
4. 插入一列 rise 来计算相邻月份总数的差
dl.insert(2, 'rise', (dl['cnt']-dl['cnt'].shift(1))/dl['cnt'].shift(1))
shift()函数对数据进行移动操作,dl['cnt'].shift(1) 表示 dl['cnt'] 列的数据向下移动一个单位
计算差值也可以直接使用 diff() 函数:对数据进行某种移动之后与原数据进行比较得出的差异数据, dl['cnt'].diff()
5. matplotlib绘图
import matplotlib.pyplot as plt dl.plot(x=dl['date'], y='rise', kind='line', linestyle='-', markerfacecolor='red', marker='o', color='green', figsize=(8, 4), grid=True)
plt.show()
plt.close()
matplotlib + pandas绘图的更多相关文章
- pandas绘图总结
转自:http://blog.csdn.net/genome_denovo/article/details/78322628 pandas绘图总结 pandas中的绘图函数(更加详细的绘图资料可参考p ...
- pandas 绘图 机器学习看特征相关性
pandas 绘图 import numpy as np import tflearn from tflearn.layers.core import dropout from tflearn.lay ...
- Matplotlib:绘图和可视化
Matplotlib:绘图和可视化 简介 简单绘制线形图 plot函数 支持图类型 保存图表 一 .简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包.数据可视化也是我们数据分 ...
- 数据分析与展示——Matplotlib基础绘图函数示例
Matplotlib库入门 Matplotlib基础绘图函数示例 pyplot基础图表函数概述 函数 说明 plt.plot(x,y,fmt, ...) 绘制一个坐标图 plt.boxplot(dat ...
- Python3 matplotlib的绘图函数subplot()简介
Python3 matplotlib的绘图函数subplot()简介 一.简介 matplotlib下, 一个 Figure 对象可以包含多个子图(Axes), 可以使用 subplot() 快速绘制 ...
- 转:使用 python Matplotlib 库 绘图 及 相关问题
使用 python Matplotlib 库绘图 转:http://blog.csdn.net/daniel_ustc/article/details/9714163 Matplotlib ...
- matplotlib动态绘图
目录 package Process 解决中文乱码问题 simple_plot() scatter_plot() three_dimension_scatter() Jupyter notebook ...
- 【Python开发】使用python中的matplotlib进行绘图分析数据
matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图.而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中. 它的文档相当完备, ...
- 吴裕雄--天生自然python学习笔记:Matplotlib 基本绘图
使用 Matplotlib 组件绘图时,经常要与 Numpy 组件搭配使用 . 使用 Matplotlib 绘图首先要导入 Matplotlib 组件 , 由于大部分绘图功能是在 matplotlib ...
随机推荐
- SpringBoot之MongoTemplate的查询可以怎么耍
学习一个新的数据库,一般怎么下手呢?基本的CURD没跑了,当可以熟练的增.删.改.查一个数据库时,可以说对这个数据库算是入门了,如果需要更进一步的话,就需要了解下数据库的特性,比如索引.事物.锁.分布 ...
- 180804-Spring之动态注册bean
Spring之动态注册bean 什么场景下,需要主动向Spring容器注册bean呢? 如我之前做个的一个支持扫表的基础平台,使用者只需要添加基础配置 + Groovy任务,就可以丢到这个平台上面来运 ...
- 将exe依赖运行的dll,合并入exe中,整个程序仅存在一个exe文件
方法一: 使用ILMerge合并winform生成的exe和引用的dll文件 参考:https://blog.csdn.net/u010108836/article/details/76782375 ...
- 《图解 HTTP 》阅读 —— 第一章
第1章 了解web及网络基础 计算机与网络设备相互通信的规则称为协议,比如:如何探测到通信目标.由哪一边发起通信.使用那种语言进行通信.怎么结束通信等. TCP/IP 协议族按照层次分为以下四层:应用 ...
- ActiveMQ笔记:管理和监控
ActiveMQ提供了比较丰富的监控和管理工具.在ActiveMQ的网页里(http://activemq.apache.org/how-can-i-monitor-activemq.html)提到了 ...
- React Native移动开发实战-3-实现页面间的数据传递
React Native使用props来实现页面间数据传递和通信.在React Native中,有两种方式可以存储和传递数据:props(属性)以及state(状态),其中: props通常是在父组件 ...
- Python基础系列讲解—动态类型语言的特点
前言 在C语言中变量所分配到的地址是内存空间中一个固定的位置,当我们改变变量值时, 对应内存空间中的值也相应改变.在Python中变量存储的机制是完全不一样的,当给一个变量赋值时首先解释器会给这个值分 ...
- Buaaclubs的NABC与发布
NEED: 本项目主要目的是实现一个社团学生公共平台,平台的宗旨是为学生提供信息,为社团提供服务,在社团和学生之间建立联系.经过调查,我们发现了用户的以下需求: 需求一:社团发布信息,同学获知信息 这 ...
- 始入OO课程的殿堂,初识面向对象的奥妙——OO第一次博客总结
当我满怀期待叩开OO的大门,却发现宝藏藏在层层阻难之后 第一次作业 1.度量分析 >关于第一次作业的metrics图分析没有出现标红的McCabe Cyclomatic Complexity或者 ...
- 第一节 Linux系统简介
一.Linux定义 Linux 是一个操作系统,就像你多少已经了解的 Windows(xp,7,8)和 Max OS. 操作系统在整个计算机系统中的角色: Linux 是系统调用和内核那两层,直观的来 ...