Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图操作。本节我们深入讲解一下 Pandas 的绘图操作。

Pandas 之所以能够实现了数据可视化,主要利用了 Matplotlib 库的 plot() 方法,它对 plot() 方法做了简单的封装,因此您可以直接调用该接口。下面看一组简单的示例:

  1. import pandas as pd
  2. import numpy as np
  3. #创建包含时间序列的数据
  4. df = pd.DataFrame(np.random.randn(8,4),index=pd.date_range('2/1/2020',periods=8), columns=list('ABCD'))
  5. df.plot()

输结果图,如下所示:


图1:Pandas绘图
 

如上图所示,如果行索引中包含日期,Pandas 会自动调用 gct().autofmt_xdate() 来格式化 x 轴。

除了使用默认的线条绘图外,您还可以使用其他绘图方式,如下所示:

  • 柱状图:bar() 或 barh()
  • 直方图:hist()
  • 箱状箱:box()
  • 区域图:area()
  • 散点图:scatter()

通过关键字参数kind可以把上述方法传递给 plot()。

柱状图

创建一个柱状图,如下所示:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d','e'])
  4. #或使用df.plot(kind="bar")
  5. df.plot.bar()

输出结果:


图2:Pandas绘制柱状图

通过设置参数stacked=True可以生成柱状堆叠图,示例如下:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(10,5),columns=['a','b','c','d','e'])
  4. df.plot(kind="bar",stacked=True)
  5. #或者使用df.plot.bar(stacked="True")

输出结果:


图3:Pandas绘制柱状图
 

如果要绘制水平柱状图,您可以使用以下方法:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
  4. print(df)
  5. df.plot.barh(stacked=True)

输出结果:


图4:水平柱状图

直方图

plot.hist() 可以实现绘制直方图,并且它还可以指定 bins(构成直方图的箱数)。

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame({'A':np.random.randn(100)+2,'B':np.random.randn(100),'C':
  4. np.random.randn(100)-2}, columns=['A', 'B', 'C'])
  5. print(df)
  6. #指定箱数为15
  7. df.plot.hist(bins=15)

输出结果:


图5:绘制直方图
 

给每一列数据都绘制一个直方图,需要使以下方法:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame({'A':np.random.randn(100)+2,'B':np.random.randn(100),'C':
  4. np.random.randn(100)-2,'D':np.random.randn(100)+3},columns=['A', 'B', 'C','D'])
  5. #使用diff绘制
  6. df.diff().hist(color="r",alpha=0.5,bins=15)

输出结果:


图6:直方图绘制

箱型图

通过调用 Series.box.plot() 、DataFrame.box.plot() 或者 DataFrame.boxplot() 方法来绘制箱型图,它将每一列数据的分布情况,以可视化的图像展现出来。

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(10, 4), columns=['A', 'B', 'C', 'D'])
  4. df.plot.box()

输出结果:


图7:绘制箱型图

区域图

您可以使用 Series.plot.area() 或 DataFrame.plot.area() 方法来绘制区域图。

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(5, 4), columns=['a', 'b', 'c', 'd'])
  4. df.plot.area()

输出结果:


图8:绘制区域图

散点图

使用 DataFrame.plot.scatter() 方法来绘制散点图,如下所示:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(np.random.rand(30, 4), columns=['a', 'b', 'c', 'd'])
  4. df.plot.scatter(x='a',y='b')

输出结果:


图9:绘制散点图

饼状图

饼状图可以通过 DataFrame.plot.pie() 方法来绘制。示例如下:

  1. import pandas as pd
  2. import numpy as np
  3. df = pd.DataFrame(3 * np.random.rand(4), index=['go', 'java', 'c++', 'c'], columns=['L'])
  4. df.plot.pie(subplots=True)

输出结果:


图10:Pandas绘制饼状图

pandas之画图的更多相关文章

  1. pandas 8 画图

    from __future__ import print_function import pandas as pd import numpy as np import matplotlib.pyplo ...

  2. python pandas 画图、显示中文、股票K线图

    目录: 1.pandas官方画图链接 2.标记图中数据点 3.画图显示中文 4.画股票K线图 5.matplotlib基本用法 6.format输出 6.format输出例子 eps_range=[0 ...

  3. Python pandas快速入门

    Python pandas快速入门2017年03月14日 17:17:52 青盏 阅读数:14292 标签: python numpy 数据分析 更多 个人分类: machine learning 来 ...

  4. Numpy and Pandas

    安装 视频链接:https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/ pip install numpy pip instal ...

  5. OnePy--构建属于自己的量化回测框架

    本文主要记录我构建量化回测系统的学习历程. 被遗弃的项目:Chandlercjy/OnePy_Old 新更新中的项目:Chandlercjy/OnePy 目录 1. 那究竟应该学习哪种编程语言比较好呢 ...

  6. [数据可视化之一]Pandas单变量画图

    Pandas单变量画图 Bar Chat Line Chart Area Chart Histogram df.plot.bar() df.plot.line() df.plot.area() df. ...

  7. 【转】Pandas学习笔记(七)plot画图

    Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...

  8. 用豆瓣加速安装pandas、numpy、matplotlib(画图)

    安装pandas.numpy会同时被安装 #pthony2.x,用豆瓣加速安装pandas pip install -i https://pypi.doubanio.com/simple/ panda ...

  9. Python | Pandas数据清洗与画图

    准备数据 2016年北京PM2.5数据集 数据源说明:美国驻华使馆的空气质量检测数据 数据清洗 1. 导入包 import numpy as np import matplotlib.pyplot a ...

  10. Pandas高级教程之:plot画图详解

    目录 简介 基础画图 其他图像 bar stacked bar barh Histograms box Area Scatter Hexagonal bin Pie 在画图中处理NaN数据 其他作图工 ...

随机推荐

  1. java 递归查子菜单

    递归查: @Override public List<PromotionOrgInfoPO> queryOrgInfo() { List<PromotionOrgInfoPO> ...

  2. C语言初级阶段7——指针1

    C语言初级阶段7--指针1 地址与指针 1.地址:数据在内存中的存储位置编号,是一个常量. 2.指针:指针的本质就是地址. 指针变量的定义和声明 1.指针变量:存储的数据是地址. 2.定义方法:类型* ...

  3. pandas数据增删改查+拼接

    pandas数据的拼接+增删改查 def lengthways_joint(df,df1): #纵向拼接 if list(df.columns) == list(df1.columns): leb_j ...

  4. CF1338E JYPnation

    题意:给定一个竞赛图,且其中不包含任意一组三元环 $(a, b, c)$,满足 $a \to d$,$b \to d$,$c \to d$,求每个点两两之间的距离之和(若无法达到即为 $614n$). ...

  5. the third change day

    2022.5.9 今日名言:青春是一个短暂的美梦,当你醒来的时候,它早已消失的无影无踪.----莎士比亚 早起听了一堂听力课,感觉他教的挺好,准备跟着试试,快考试了,别来不及了. 目录 听力技巧 阅读 ...

  6. 使用Eclipse快速开发jsp和.编码问题、JSP页面元素以及request对象

    在IDEA中创建的Web项目: 浏览器可以直接访问WebContent中的文件. 例如http:// localhost:8888/MyJspProject/index1.jsp其中的index1.j ...

  7. SQL SERVER 2014 双机热备操作流程-数据库双向同步 (第一篇:发布)

    需求:需要两个数据库双向同步,即A数据库变动,B及时更新.B数据库变动,A及时更新.思路:利用SQL Server的发布和订阅功能进行同步,在A数据库进行发布<合并发布>,在B数据库进行订 ...

  8. BeanFactory与FactoryBean区别

    1. BeanFactory BeanFactory,以Factory结尾,表示它是一个工厂类(接口),用于管理Bean的一个工厂.在Spring中,BeanFactory是IOC容器的核心接口,也是 ...

  9. 接口自动化之request几种常见请求及响应方法

    request 的几种常见方法 1.request.get() 发送get请求 2.request.post() 发送post请求 3.request.delete() 发送delete请求 4.re ...

  10. Jx9嵌入式脚本语言基本用法

    Jx9是一种嵌入式脚本语言,可用于编写嵌入式脚本和扩展. 以下是一些使用Jx9的示例: 1. 计算器 Jx9可以轻松实现一个计算器.例如: ```print("Enter two numbe ...