数据分析——matplotlib的用法
Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值、必要的一些数据转换等。完成数据分析的最终结果也许就是做一个可交互的数据可视化
安装方式: pip install matplotlib
引用方法:import matplotlib.pyplot as plt
一、plot函数(绘制折线图)
- 线型linestyle(-,-.,--,..)
- 点型marker(v,^,s,*,H,+,X,D,O,...)
- 颜色color(b,g,r,y,k,w,...)
# 解决乱码问题(中文不显示)
plt.rcParams['font.sans-serif'] = ['SimHei']
x = [1,2,3]
y = [2,4,9] plt.figure(figsize=(20,6)) #设置画布的大小 plt.title('标题', fontsize=20, color='red') #设置标题
plt.xlabel('x轴', fontsize=15) #设置x轴名称
plt.ylabel('y轴', fontsize=15) #设置y轴名称 # plt.plot?
# plt.plot(x,y, color='green', marker='v', linestyle='--')
plt.plot(x, y) plt.show()

图像标注
| 方法 | 描述 | |
|---|---|---|
| plt.title() | 设置图像标题 | |
| plt.xlabel() | 设置x轴名称 | |
| plt.ylabel() | 设置y轴名称 | |
| plt.xlim() | 设置x轴范围 | |
| plt.ylim() | 设置y轴范围 | |
| plt.xticks() | 设置x轴刻度 | |
| plt.yticks() | 设置y轴刻度 | |
| plt.legend() | 设置曲线图例 |
plt.plot([0,3,9,15,30],linestyle = '-.',color = 'r',marker = 'o',label="A")
plt.plot([1,3,16,23,30],[30,23,13,25,30],label='B')
plt.title("Title") # 标题
plt.xlabel('X') # x轴名称
plt.ylabel('Y') # y轴名称 plt.xticks(np.arange(0,30,2)) # x轴刻度
plt.xlim(-0.2,10,2) # x轴范围
plt.legend() # 曲线图标
plt.show()

支持的图类型
| 函数 | 说明 | |
|---|---|---|
| plt.plot(x,y,fmt) | 折线图 | |
| plt.boxplot(data,notch,position) | 箱型图 | |
| plt.bar(left,height,width,bottom) | 柱状图 | |
| plt.barh(width,bottom,left,height) | 横向柱状图 | |
| plt.polar(theta,r) | 极坐标系 | |
| plt.pie(data,explode) | 饼图 | |
| plt.psd(x,NFFT=256,pad_to,Fs) | 功率谱密度图 | |
| plt.specgram(x,NFFT=256,pad_to,F) | 谱图 | |
| plt.cohere(x,y,NFFT=256,Fs) | X-Y相关性函数 | |
| plt.scatter(x,y) | 散点图 | |
| plt.step(x,y,where) | 步阶图 | |
| plt.hist(x,bins,normed) | 直方图 |
二.柱状图
x = movies.index #索引值
y = movies.values #数据值 plt.figure(figsize=(15,6)) #设置画布大小 plt.bar(x, y, color='blue') #柱状图用bar
plt.title('每个国家或者地区的电影数量') plt.xlabel('国家或地区', fontsize=20)
plt.ylabel('电影数量', fontsize=20)
plt.xticks(rotation=90, fontsize=15) #x轴数据旋转90度 # plt.text?
for a,b in zip(x,y):
plt.text(a, b+100, b, ha='center') #柱状图上面的文字 plt.show()

三.饼图
饼图是计算某一范围内数据的百分比,那么先要切分统计每个范围内的数据百分比
先切分,使用cut
data = pd.cut(s.astype('float'), [0,60,90,110,1000]).value_counts()
使用pie做饼状图
x = data.index
y = data.values plt.figure(figsize=(10,6))
plt.title('电影时长分布图')
patchs, l_text, p_text = plt.pie(y, labels=x, autopct='%0.2f%%', colors='bgry', startangle=90) for i in p_text:
i.set_size(15)
i.set_color('w') #饼状图内百分比样式设计 for l in l_text:
l.set_size(20)
l.set_color('r') #饼状图外范围设计 plt.show()
四.保存图表
plt.savefig('123.pdf')
数据分析——matplotlib的用法的更多相关文章
- matplotlib基本用法-【老鱼学matplotlib】
本文介绍一下matplotlib的最基本用法. 这次我们要显示一个线性方程的直线. 首先要引入matplotlib库,一般是用plt这个简写的,我们就按照大多数人的惯例来进行命名: import ma ...
- python 数据分析 Matplotlib常用图表
Matplotlib绘图一般用于数据可视化 常用的图表有: 折线图 散点图/气泡图 条形图/柱状图 饼图 直方图 箱线图 热力图 需要学习的不只是如何绘图,更要知道什么样的数据用什么图表展示效果最好 ...
- Python数据分析-Matplotlib图标绘制
Matplotlib介绍 Matplotlib是一个强大的Python绘图和数据可视化的工具包. Matplotlib的主要功能 Matplotlib是python中的一个包,主要用于绘制2D图形(当 ...
- 博学谷-数据分析matplotlib
博学谷-数据分析 python数学学科的基础 机器学习课程的基础 1.1 介绍 1.2 jupyter和conda 1.3 matplotlib from matplotlib import pypl ...
- 数据分析 - Matplotlib
简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包.数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值.必要的一些数据转换等.完成数据分析 ...
- 数据分析-numpy的用法
一.jupyter notebook 两种安装和启动的方式: 第一种方式: 命令行安装:pip install jupyter 启动:cmd 中输入 jupyter notebook 缺点:必须手动去 ...
- Python数据分析中Groupby用法之通过字典或Series进行分组
在数据分析中有时候需要自己定义分组规则 这里简单介绍一下用一个字典实现分组 people=DataFrame( np.random.randn(5,5), columns=['a','b','c',' ...
- 数据分析-Matplotlib:绘图和可视化
学习路线 简介 简单绘制线形图 plot函数 支持图类型 保存图表 1.简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包.数据可视化也是我们数据分析的最重要的工作之一,可以帮 ...
- matplotlib 高级用法实例--共享x轴
http://localhost:8888/notebooks/duanqs/matplotlib_advanced_example.ipynb 我不会弄呀, 刚才从matplotlib文档里吧示例用 ...
随机推荐
- learning scala someElements
The Scala collections library provides specialised implementations for Sets of fewer than 5 values ( ...
- tbls ci 友好的数据库文档化工具
tbls 是用golang 编写的数据库文档化工具,当前支持的数据库有pg.mysql.bigquery 此工具同时提供了变更对比.lint 校验,生成是markdown格式的 简单使用 安装 mac ...
- 计蒜之道 百度AI小课堂-上升子序列
计蒜之道 百度AI小课堂-上升子序列 题目描述 给一个长度为 \(n\) 的数组 \(a\) .试将其划分为两个严格上升子序列,并使其长度差最小. 输入格式 输入包含多组数据. 数据的第一行为一个正整 ...
- CF #365 DIV2 D Mishka and Interesting sum 区间异或+线段树
D. Mishka and Interesting sum time limit per test 3.5 seconds memory limit per test 256 megabytes in ...
- 【NOIP2014】真题回顾
题目链接 生活大爆炸版石头剪刀布 就是个模拟,不说了 联合权值 枚举每个点,统计它任意两个儿子的联合权值,统计的时候维护sum和max就行了 飞扬的小鸟 比较好的DP题,不难想到用dp[i][j]表示 ...
- PHP全栈学习笔记33
javascript能做什么? 语句与注解,标识符,字面量,变量命名规范 JavaScript中的数据类型,其它类型如何转为数据型,操作符 字符方法,数组方法,函数与对象,函数表达式,变量作用域,对象 ...
- Android入门教程(八)
关注我,每天都有优质技术文章推送,工作,学习累了的时候放松一下自己. 本篇文章同步微信公众号 欢迎大家关注我的微信公众号:「醉翁猫咪」 今天讲讲安卓入门(八),讲讲Android的简介,如何搭建An ...
- hhhhh我又双叒进步啦!
虽然说从今天开始短暂的暑假一周假期正式开始,然而第一天我就深感在家有多无聊...所以说还是整天待在学校好丫! 不过,就算在家, 勤奋好学的 我也要认真做题!今天就一鼓作气地把排名刷到了第 50 名!! ...
- 当变量超过任意设定的变量限制时终止fluent模拟【翻译】
一些时候某个特定的变量(压力,速度,温度等)发散会造成不合理的计算结果.在许多算例,当变量超过某些合理的限制时,自动停止/打断模拟是有帮助的. 解决方法是联合UDF和scheme文件.UDF将会遍历所 ...
- NIO Channel Scatter/Gather 管道Pipe类
通道提供了一种被称为Scatter/Gather的重要新功能(有时也被称为矢量I/O).Scatter/Gather是一个简单却强大的概念,它是指在多个缓冲区上实现一个简单的I/O操作.对于一个wri ...