pandas可视化:各种图的简单使用
一、Matplotlib中几种图的名字
- 折线图:plot
- 柱形图:bar
- 直方图:hist
- 箱线图:box
- 密度图:kde
- 面积图:area
- 散点图:scatter
- 散点图矩阵:scatter_matrix
- 饼图:pie
二、折线图:plot
平均值需要先排序后出出图
df.avg.value_counts().sort_index().plot()
三、柱形图:bar
可先做数据透视,然后生成柱形图
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar()
如果是要做堆叠柱形图,则可设置bar()的参数
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.bar(stacked=True)
如果是要做成条形图,则可修改bar()方法为bar()
df.pivot_table(index='city',columns='education',values='avg',aggfunc='count').plot.barh()
四、直方图:hist
df.avg.plot.hist()
以“education”字段多维分析,对平均值绘制直方图,
alpha:图形透明度;
stacked:是否堆叠;
bins:密度;
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.hist(alpha=0.5,stacked=True,bins=30)
五、箱线图:box
用法一:与“直方图”类似
df.groupby('education').apply(lambda x:x.avg).unstack().T.plot.box()
用法二:
df.boxplot(column='avg',by='education')
六、密度图:kde
df.avg.plot.kde()
七、面积图:area
一般将数据进行分类(数据透视),
df.pivot_table(index='avg',columns='education',values='positonId',aggfunc='count').plot.area()
八、散点图:scatter
按公司分类,以平均值为x轴,数量为y轴
df.groupby('companyId').aggregate(['mean','count']).avg.plot.scatter(x='mean',y='count')
九、散点图矩阵:scatter_matrix(Pandas的函数)
适用于两个以上的参数,两两组合
matrix=df.groupby('companyId').aggregate(['mean','count',max]).avg
pd.plotting.scatter_matrix(matrix.query('count<50'),diagonal='kde')
查询条件:计数小于50
diagonal:修改图的类型(kde:密度图)
十、饼图:pie
df.city.value_counts().plot.pie(figsize=(6,6))
figsize:图的长宽
pandas可视化:各种图的简单使用的更多相关文章
- G6:AntV 的图可视化与图分析
导读 G6 是 AntV 旗下的一款专业级图可视化引擎,它在高定制能力的基础上,提供简单.易用的接口以及一系列设计优雅的图可视化解决方案,是阿里经济体图可视化与图分析的基础设施.今年 AntV 11. ...
- MongoDB在Windows下安装、Shell客户端的使用、Bson扩充的数据类型、MongoVUE可视化工具安装和简单使用、Robomongo可视化工具(2)
一.Windows 下载安装 1.去http://www.mongodb.org/downloads下载,mongodb默认安装在C:\Program Files\MongoDB目录下,到F:\Off ...
- 可视化Tensorboard图中的符号意义
可视化Tensorboard图中的符号意义
- NLP(十二)依存句法分析的可视化及图分析
依存句法分析的效果虽然没有像分词.NER的效果来的好,但也有其使用价值,在日常的工作中,我们免不了要和其打交道.笔者这几天一直在想如何分析依存句法分析的结果,一个重要的方面便是其可视化和它的图分析 ...
- pandas知识点脑图汇总
参考文献: [1]Pandas知识点脑图汇总
- Neo4j属性图模型简单介绍
本文主要是对Neo4j属性图模型简单的介绍. Neo4j是什么? Neo4j是一款是由java语言实现的图数据库,图形数据库将数据以图的数据结构进行存储和管理,并且能够以高度可问的方式优雅地表示任何种 ...
- Pandas可视化
基本绘图:绘图 Series和DataFrame上的这个功能只是使用matplotlib库的plot()方法的简单包装实现.参考以下示例代码 - import pandas as pd import ...
- ubuntu安装mysql可视化工具MySQL-workbench及简单操作
一.使用命令行在ubuntu下安装mysql可视化工具MySQL-workbench Step1:安装MySQL-workbench 方案一:如果你已经装好mysql的相关服务,那么直接使用如下命令即 ...
- Pandas plot出图
1.创建一个Series 这是一个线性的数据,我们随机生成1000个数据,Series 默认的 index 就是从0开始的整数,但是这里我显式赋值以便让大家看的更清楚 >>> imp ...
随机推荐
- Unity的赛车游戏实现思路
unity目前版本实现赛车的技术方案主要有3种: 1.wheelCollider,设置motorTorque.brakeTorque.steerAngle来实现车子的推动和转弯,优点是上手简单,而且很 ...
- 《机器学习基石》---VC维
1 VC维的定义 VC维其实就是第一个break point的之前的样本容量.标准定义是:对一个假设空间,如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开,则称该假设空间能够把N个 ...
- Django安装于基本介绍
pycharm果然是最强大的python IDE,在创建Diango项目时如果没有则自动下载. 然而即使是这样,我在安装Django的时候还是比较曲折的. Django的安装方式有很多,但是因为网络问 ...
- powerdesigner16.6版本resource的重复使用
今天早上遇到想要重复使用resource ,但是发现powerdesigner16.6版本跟16.5版本有关重复使用name的设置已经不一样了,网上找了好久没找到,软件上找了好久也没找到相应的设置. ...
- Go输入输出格式化Printf
package main import ( "fmt" "os" ) type point struct { x, y int } func main() { ...
- Ubuntu Server : 自动更新
Ubuntu(16.04/18.04) 默认会每天自动安装系统的安全更新,但是不会自动安装包的更新.本文梳理 Ubuntu 16.04/18.04 系统的自动更新机制,并介绍如何配置系统自动更新所有的 ...
- Linux - 通过expect工具实现脚本的自动交互
目录 1 安装expect工具 2 expect的常用命令 3 作用原理简介 3.1 示例脚本 3.2 脚本功能解读 4 其他脚本使用示例 4.1 直接通过expect执行多条命令 4.2 通过she ...
- spark任务调度模式,动态资源分配
官网链接: http://spark.apache.org/docs/latest/job-scheduling.html 主要介绍: 1 application级调度方式 2 单个applicati ...
- Homebrew 安装 Docker Desktop for Mac
无意中发现Homebrew现在已经支持Docker Desktop for Mac了,因此特意把原来通过 https://docs.docker.com/docker-for-mac/install/ ...
- C++ 重载运算符(详)
C++ 重载运算符 C 重载运算符 一重载函数 1例程 2备注 二重载运算符 11 二元运算符重载 11 一元运算符重载 111 -- 2备注 3 特殊运算符重载 31 号运算符 32 下标运算符 3 ...