用matplotlib对数据可视化

下图是要用到的数据集，反映了从1984到2016年的失业率的变化

　1.导入可视化模块import matlibplot.pyplot as plt，函数plt.plot(x, y)确定折线图的点,x是由这些点的x坐标组成的列表，y是由这些点的y坐标组成

的列表。plt.show()显示图像，plt.xlabel()给x轴命名，plt.xticks()可以设置x坐标刻度点旋转指定角度，plt.title()给折线图命名

　　下面的代码是以上函数的应用

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 #画出1984年失业率折线图

 unrated = pd.read_csv("C:/学习/python/hello/UNRATE.csv")

 first_twelve = unrated.head()

 x_series = first_twelve["DATE"]

 y_series = first_twelve["VALUE"]

 plt.xticks(rotation=)

 plt.xlabel("Month")

 plt.ylabel("Unemployment rate")

 plt.title("Unemployment rate trends on 1984")

 plt.plot(x_series, y_series)

 plt.show()

　　运行结果如下

2.通过plt.subplot(n, m, x)在一个figure中添加多个子图, n和m表示子图的布局，分别代表行数和列数，x表示从左往右，从上往下数的第x个子图

下面的代码提供了该函数使用实例

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 plt.figure(figsize=(, ))

 ax1 = plt.subplot(, , )

 ax2 = plt.subplot(, , )

 ax3 = plt.subplot(, , )

 ax5 = plt.subplot(, , )

 plt.show()

运行结果如下

3.下面的代码是在一个坐标轴中画多个折线图的示例

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 unrated = pd.read_csv("C:/学习/python/hello/UNRATE.csv")

 unrated["DATE"] = pd.to_datetime(unrated["DATE"])

 color = ["red", "yellow", "blue", "green", "purple"]

 plt.figure(figsize=(, ))

 for i in range():

     sub_unrated = unrated.loc[i*:(i+)*-]

     sub_unrated_x = sub_unrated['DATE'].dt.month

     sub_unrated_y = sub_unrated["VALUE"]

     label = +i

     plt.plot(sub_unrated_x, sub_unrated_y, color=color[i], label=label)

 plt.legend(loc="best")

 plt.show()

运行结果如下

4.figure和subplot的定义顺序决定了subplot是画在哪个figure中。当代码中定义了多个figure时候，紧接着该figure定义的subplot才画在该figure中，

如下代码所示，定义了figure1和figure2，ax1和ax2在figure1中，ax在figure2中。

 plt.figure(figsize=(, ))

 ax1 = plt.subplot(,,)

 plt.figure(figsize=(, ))

 ax = plt.subplot(, , )

 plt.show()

5.用matplotlib画条形图

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

reviews = pd.read_csv("C:/学习/python/hello/fandango_score_comparison.csv")
cols = ["FILM", "RT_user_norm", "Metacritic_user_nom", "IMDB_norm", "Fandango_Ratingvalue", "Fandango_Stars"]
norm_reviews = reviews[cols]

num_cols = ["RT_user_norm", "Metacritic_user_nom", "IMDB_norm", "Fandango_Ratingvalue", "Fandango_Stars"]
bar_height = norm_reviews.loc[0, num_cols].values  #第一部电影的评价，注意利用loc索引某一行的用法，可以添加第二维

bar_position = 1 + np.arange(5)  #arange返回的是ndarray类型，range返回的是list类，使用arange需要用numpy
plt.figure(figsize=(10, 10))
ax = plt.subplot(1, 1, 1)
ax.bar(bar_position, bar_height, 0.3)  #bar_position是条形图的x坐标(中点坐标),bar_height是高，0.3是宽
#设置x坐标刻度
tick_positions = range(1, 6)
ax.set_xticks(tick_positions)
ax.set_xticklabels(num_cols)

#设置x轴和y轴名称
ax.set_xlabel("Rating Source")
ax.set_ylabel("Average Rating")
ax.set_title("Whatever")
plt.show()

运行结果如下

　　将上面的代码改变几处，就会成为横着的条形图了。代码如下所示（改动之处用白底红字加粗下划线标出来了）

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 reviews = pd.read_csv("C:/学习/python/hello/fandango_score_comparison.csv")

 cols = ["FILM", "RT_user_norm", "Metacritic_user_nom", "IMDB_norm", "Fandango_Ratingvalue", "Fandango_Stars"]

 norm_reviews = reviews[cols]

 num_cols = ["RT_user_norm", "Metacritic_user_nom", "IMDB_norm", "Fandango_Ratingvalue", "Fandango_Stars"]

 bar_height = norm_reviews.loc[, num_cols].values  #第一部电影的评价，注意利用loc索引某一行的用法，可以添加第二维

 bar_position =  + np.arange()  #arange返回的是ndarray类型，range返回的是list类，使用arange需要用numpy

 plt.figure(figsize=(, ))

 ax = plt.subplot(, , )

 ax.barh(bar_position, bar_height, 0.3)  #bar_position是条形图的x坐标(中点坐标),bar_height是高，.3是宽

 #设置x坐标刻度

 tick_positions = range(, )

 ax.set_yticks(tick_positions)

 ax.set_yticklabels(num_cols)

 #设置x轴和y轴名称

 ax.set_ylabel("Rating Source")

 ax.set_xlabel("Average Rating")

 ax.set_title("Whatever")

 plt.show()

运行结果如下

6.画散点图

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 reviews = pd.read_csv("C:/学习/python/hello/fandango_score_comparison.csv")

 plt.figure(figsize=(,))

 ax = plt.subplot(, , )

 ax.scatter(reviews["RT_norm"], reviews["Metacritic_user_nom"])

 plt.show()

运行结果如下

7.设a是Series类型，b = a.value_counts()可以得到a的一个频数统计，b是Series结构，b的index是a的值，b的value是该值出现的频数。

如下代码所示

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 reviews = pd.read_csv("C:/学习/python/hello/fandango_score_comparison.csv")

 cols = ["FILM", "RT_user_norm", "Metacritic_user_nom", "Fandango_Ratingvalue"]

 norm_reviews = reviews[cols]

 #fandango_distribution是Series结构，index是原来的列的值，value是该值出现的频率

 fandango_distribution = norm_reviews["Fandango_Ratingvalue"].value_counts()

 print(fandango_distribution.head())

 print(type(fandango_distribution))

 print(fandango_distribution.index)

运行结果如下

8.我们来画直方图

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 reviews = pd.read_csv("C:/学习/python/hello/fandango_score_comparison.csv")

 cols = ["FILM", "RT_user_norm", "Metacritic_user_nom","IMDB_norm", "Fandango_Ratingvalue"]

 norm_reviews = reviews[cols]

 plt.figure(figsize=(, ))

 ax = plt.subplot(, , )

 ax.hist(norm_reviews["RT_user_norm"], bins=) #参数bins表示直方图的x轴分成多少区间

 plt.show()

运行结果如下

用matplotlib对数据可视化的更多相关文章

matplotlib实现数据可视化
一篇matplotlib库的学习博文.matplotlib对于数据可视化非常重要,它完全封装了MatLab的所有API,在python的环境下和Python的语法一起使用更是相得益彰. 一.库的安装和 ...
基于matplotlib的数据可视化 - 笔记
1 基本绘图在plot()函数中只有x,y两个量时. import numpy as np import matplotlib.pyplot as plt # 生成曲线上各个点的x,y坐标,然后用一 ...
【Matplotlib】数据可视化实例分析
数据可视化实例分析作者:白宁超 2017年7月19日09:09:07 摘要:数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息.但是,这并不就意味着数据可视化就一定因为要实现其功能用途而令 ...
使用 jupyter-notebook + python + matplotlib 进行数据可视化
上次用 python 脚本中定期查询数据库,监视订单变化,将时间与处理完成订单的数量进行输入写入日志,虽然省掉了人为定时查看数据库并记录的操作,但是数据不进行分析只是数据,要让数据活起来! 为了方便看 ...
基于matplotlib的数据可视化 - 等高线 contour 与 contourf
contour 与contourf 是绘制等高线的利器. contour - 绘制等高线 contourf - 填充等高线两个的返回值值是一样的(return values are the sam ...
『Matplotlib』数据可视化专项
一.相关知识官网介绍 matplotlib API 相关博客 matplotlib绘图基础漂亮插图demo 使用seaborn绘制漂亮的热度图 fig, ax = plt.subplots(2,2 ...
基于matplotlib的数据可视化 - 饼状图pie
绘制饼状图的基本语法创建数组 x 的饼图,每个楔形的面积由 x / sum(x) 决定: 若 sum(x) < 1,则 x 数组不会被标准化,x 值即为楔形区域面积占比.注意,该种情况会出现 ...
基于matplotlib的数据可视化 - 热图imshow
热图: Display an image on the axes. 可以用来比较两个矩阵的相似程度 mp.imshow(z, cmap=颜色映射,origin=垂直轴向) imshow( X, cma ...
基于matplotlib的数据可视化 -
matplotlib.pyplot(as mp or as plt)提供基于python语言的绘图函数引用方式: import matplotlib.pyplot as mp / as plt 本章 ...
Python学习笔记：Matplotlib（数据可视化）
Matplotlib是一个可以将数据绘制为图形表示的Python三方库,包括线性图(折线图,函数图).柱形图.饼图等基础而直观的图形,在平常的开发当中需要绘图时就非常有用了. 安装:pip insta ...

随机推荐

react-native启动时红屏报错：Unable to load script.Make sure you're either running a metro server or that ....
一.报错信息内容我是在Android Studio中运行启动react-native项目时报的这个错误 1.报错提示:Unable to load script.Make sure you're e ...
【HDU5289】Assignment
题目大意:给定一个长度为 N 的序列,求序列中最大值和最小值相差小于 K 的连续段的个数. 题解: 最大值和最小值相差不超过 K 是一个在值域角度的限制,应考虑采用平衡树或权值...数据结构进行维护. ...
第三篇：解析库之re、beautifulsoup、pyquery
BeatifulSoup模块一.介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Be ...
【NOIP2016提高A组模拟8.17】(雅礼联考day1)总结
考的还ok,暴力分很多,但有点意外的错误. 第一题找规律的题目,推了好久.100分第二题dp,没想到. 第三题树状数组.比赛上打了个分段,准备拿60分,因为时间不够,没有对拍,其中有分段的20分莫名 ...
redis 日志等级说明
redis loglevel 安装默认的设置为 verbose 1)debug:会打印出很多信息,适用于开发和测试阶段 2)verbose(冗长的):包含很多不太有用的信息,但比debug要清晰一些 ...
dell笔记本 win10 下安装 ubuntu16.04 踩坑记录
硬件配置情况: dell笔记本-灵越-5577 —— I5七代(带有集显),8G内存条DDR4,GTX1050,128G固态硬盘,1T机械硬盘. 固态硬盘划分为3部分,100GB给win10的C盘,1 ...
ubuntu下恢复被rm删除的文件
ubuntu是文件系统,不像windows系统划分盘符(C/D/E/etc...盘).ubuntu对磁盘划分分区,可以使用extundelete恢复ext3/ext4格式的磁盘分区. 其中,ext3/ ...
Jprofiler远程监控JVM
一.下载并安装本地和远程服务器分别安装Jprofiler,下载地址二.Windows远程连接JVM配置 1.打开Windows客户端Jprofiler 2.点Cancel 3.创建远程会话 4.添 ...
关于TCP/IP，必须知道的十个知识点(转)
三次握手四次挥手可参考:http三次握手,四次挥手本文整理了一些TCP/IP协议簇中需要必知必会的十大问题,既是面试高频问题,又是程序员必备基础素养. 一.TCP/IP模型 TCP/IP协议模型(T ...
mysql 数据增删改的总结
一.在MySQL管理软件中,可以通过SQL语句中的DML语言来实现数据的操作,包括 1.使用INSERT实现数据的插入2.UPDATE实现数据的更新3.使用DELETE实现数据的删除4.使用SELEC ...

用matplotlib对数据可视化

用matplotlib对数据可视化的更多相关文章

随机推荐

热门专题