数据分析 - matpltlib 模块
matplotlib 模块
引入模块
import matplotlib.pyplot as plt
设置图片大小 - figure

展示图片 - show

画图 - 实例化后指定类型画图

plot - 折线图
scatter - 散点图
subplots - 条形图
同一个实例可以指定多个图形组合
只要在一个实例里面, 最后画的图就都在一张图里面
指定样式 - color / linestyle / linewidth / alpha


保存图片 - savefig

设置中文 - rc / font_manager
默认的 matplotlib 的中文显示是乱码, 通过此方法可以进行设置
方式一
注意名字要写对, 不然无法生效
如果不知道名字


方式二
适用于mac 版本中

实例化字体, 然后在使用的地方指定 fontproperties 参数即可

调整坐标轴轴刻度 - xticks,yticks
显示技巧
直接传入参数也可以表示指定 x 轴显示信息,可以用于截断信息
比如 xticks(range(3)) x 轴只展示为 0,1,2,3 时的信息
常会使用 plt.xticks(x_labels[::3]) 来显示以步长扩大三倍的的 x 显示
传入两个可以一一对应的序列的时候, 就会用后者的显示来代替前者, 这样可以实现字符串的显示, 比如小时日期等

设置偏移 - rotation
默认的是无偏移 180° , 如果字段较长会有重叠像上图所示
使用此函数可以进行修正角度, 正常展示
y 轴技巧
y 轴的刻度可以直接这样取也可以

添加描述 - xlabel / ylabel / title

设置网格线 - grid

这里面的参数可以设置样式的那些 color / linestyle / linewidth / alpha 等
添加图例 - legend

porp 指定字体
如果还是存在中文问题, 这里使用 prop 指定自己的字体

loc 指定位置
可传数字可传字符串

示例
二维样本文件
样本数据 - unrate.csv
从1948年1月到2016年8月的每个月的失业人数总占比

折线图
基础画图展示 - plot, show
plot 传入参数分别表示 x, y 的取值列名变量
可选参数
c 表示画图线颜色
label 表示画图线备注, 只写此属性是无法显示出来的需要配合 legend 才可以显示

调整坐标轴轴刻度 - xticks,yticks

指定信息备注 - xlabel, ylabel, title
加 x y 轴说明以及标题

展示备注信息 - legend
loc 表示展示位置, 可选如下, 使用 best 表示默认显示在最佳位置
可选参数


颜色粗细等细节设置 - plot( c=( , , ), linewidth= )


综合展示

子图操作


创建子图 - figure,add_subplot
figure 创建一个空画图域, 可以理解为创建一个空的矩阵, 也可以通过 figsize 参数规定大小
add_subplot 设定画图域的边界. 传入三个参数. 可以理解为空矩阵的长宽划分区域
参数详解: 如下 3,2 表示 y = 0-3 x = 0-2 , 然后这样区分为 6 个区域, 第三个参数表示指定区域


综合子图实例 - 良好的排列


条形图

创建设定条形图 - subplots, bar
subplots 创建返回的第二个返回值为柱形图实例
使用此实例调用 bar/barh 方法, 传入参数类似于折线, x 以及 y, 第三个参数 表示 柱粗
set_xticks - 设置 x 轴 取值
set_xticklabels - 设置x 轴显示名 可跟参数 rotation 设置倾斜角度
set_yticks - 设置 y 轴取值
set_yticklabels - 设置 y 轴 显示名 可跟参数 rotation 设置倾斜角度


条形图显示参数设置 - set_title,set_xlabel,set_ylabel
set_title - 设置标题
set_xlabel - 设置 x label
set_ylabel - 设置 y label

散点图

创建设定散点图 - subplots,scatter
操作就类似于 柱状图了. 区别在于 bar 以及 scatter 的不同区分不同的类型图

散点图显示参数设置 - set_title,set_xlabel,set_ylabel
这些也和上面柱状图一样了. 一下实例中配合有子图

柱状图
类似这种区间值, 可以使用柱状图来处理减少 x 轴的量让数据更直观

创建设定柱形图 - subplots,hist
操作类似于条形图,
hist 可选参数 bins - 区间数量, range - 区间取值

柱形图显示参数设置 - set_title,set_xlabel,set_ylabel



盒型图 - 四分图
讲一个数据划分为4份, 然后进行表示查看分布


创建设定盒图 - subplots,boxplot


数据分析 - matpltlib 模块的更多相关文章
- Python爬虫与数据分析之模块:内置模块、开源模块、自定义模块
专栏目录: Python爬虫与数据分析之python教学视频.python源码分享,python Python爬虫与数据分析之基础教程:Python的语法.字典.元组.列表 Python爬虫与数据分析 ...
- Python数据分析 Pandas模块 基础数据结构与简介(一)
pandas 入门 简介 pandas 组成 = 数据面板 + 数据分析工具 poandas 把数组分为3类 一维矩阵:Series 把ndarray强大在可以存储任意数据类型可以专门处理时间数据 二 ...
- Python数据分析-Day2-Pandas模块
1.pandas简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标 ...
- 数据分析 - seaborn 模块
seaborn 模块 简述 对 matplotlib 模块进行了二次封装, 底层依旧使用还是 matplotlib 的, 但是在此基础上增加了很多的易用性模板, 更加方便使用 引用使用 import ...
- 数据分析 - numpy 模块
numpy 概述 ▨ Numerical Python. 补充了python所欠缺的数值计算能力 ▨ Numpy是其他数据分析及机器学习库的底层库 ▨ Numpy完全标准C语言实现,运行效率充分 ...
- 大数据分析——sklearn模块安装
前提条件:numpy.scipy以及matplotlib库的安装 (注:所有操作都在pycharm命令终端进行) ①numpy安装 pip install numpy ②scipy安装 pip ins ...
- Python数据分析-Day1-Numpy模块
1.numpy.genfromtxt读取txt文件 import numpyworld_alcohol = numpy.genfromtxt("world_alcohol.txt" ...
- Python数据分析 Pandas模块 基础数据结构与简介(二)
重点方法 分组:groupby('列名') groupby(['列1'],['列2'........]) 分组步骤: (spiltting)拆分 按照一些规则将数据分为不同的组 (Applying)申 ...
- 数据分析 - pandas 模块
数据读取结构 - DataFrame Series (collection of values) DataFrame (collection of Series objects) Panel (co ...
随机推荐
- 【51nod2026】Gcd and Lcm(杜教筛)
题目传送门:51nod 我们可以先观察一下这个$f(x)=\sum_{d|x}\mu(d) \cdot d$. 首先它是个积性函数,并且$f(p^k)=1-p \ (k>0)$,这说明函数$f( ...
- shell脚本编写之Hello World
Linux下编写第一个Shell脚本 //创建一个.sh文件 vi demo1.sh //按i进入编辑模式 echo "Hello World !" //按esc→shift+:→ ...
- VMware虚拟机与Linux Centos7下载及安装教程
1.CentOS下载CentOS是免费版,推荐在官网上直接下载,网址:https://www.centos.org/download/ DVD ISO:普通光盘完整安装版镜像,可离线安装到计算机硬盘上 ...
- Java 读取 .properties 文件的几种方式
Java 读取 .properties 配置文件的几种方式 Java 开发中,需要将一些易变的配置参数放置再 XML 配置文件或者 properties 配置文件中.然而 XML 配置文件需要通过 ...
- Packet for query is too large (4,544,730 > 4,194,304). You can change this value on the server by setting the 'max_allowed_packet' variable.
修改 my.ini 加上 max_allowed_packet =6710886467108864=64M默认大小4194304 也就是4M修改完成之后要重启mysql服务,如果通过命令行修改就不用 ...
- java 使用POI导出百万级数据
先看结果吧,这只是测试其中有很多因数影响了性能. 表总数为:7千多万,测试导出100万 表字段有17个字段 最终excel大小有60多兆 总耗时:126165毫秒 差不多2分多钟 其核心简单来说就是分 ...
- Linux下的头文件搜索路径
对于以压缩包发布的软件,在它的目录下通常都有一个配置脚本configure,它的作用确定编译参数(比如头文件位置.连接库位置等),然后生成Makefile以编译程序.可以进入该软件的目录,执 ...
- kafka启动失败错误:: replica.fetch.max.bytes should be equal or greater than message.max.bytes
1 详细异常 2019-10-14 14:38:21,260 FATAL kafka.Kafka$: java.lang.IllegalArgumentException: requirement f ...
- 简单介绍 Java 构造器
导读 构造器是编程的强大组件.使用它们来释放 Java 的全部潜力. 在开源.跨平台编程领域,Java 无疑(?)是无可争议的重量级语言.尽管有许多伟大的跨平台框架,但很少有像 Java 那样统一和直 ...
- js修改元素的属性
<script type="text/javascript"> //给id为nice的元素 添加title属性并赋值为"测试title" funct ...