Pycon 2017: Python可视化库大全
本文首发于微信公众号“Python数据之道”
前言
本文主要摘录自 pycon 2017大会的一个演讲,同时结合自己的一些理解。
pycon 2017的相关演讲主题是“The Python Visualization Landscape”。
先来一张全景图镇楼~~
看完这张图是不是有点懵?
别着急,我们一起来看看后面的阐述。
python可视化库可以大致分为几类:
基于matplotlib的可视化库
基于JS的可视化库
基于上述两者或其他组合功能的库
基于matplotlib的可视化库
matplotlib是python可视化库的基础。matplotlib库的设计参考了matlab,甚至连名称也是以“mat”开头。
matplotlib库的一些优势:(翻译比较别扭,英文原文也附后)
设计很像Matlab,容易进行转换(Designed like Matlab: switching was easy)
有很多渲染后端(Many rendering backends)
差不多可以绘制任何图(当然需要花费些努力)(Can reproduce just about any plot with a bit of effort)
有长时间良好运行的历史 (Well-tested, standard tool for over a decade)
matplotlib库的一些缺点:
必须要掌握API,且描述较为冗长(API is imperative & often overly berbose)
有时候默认的样式设计比较弱(Sometimes poor stylistic defaults)
对网页以及交互式绘图的支持较弱(Poor support for web/interactive graphs)
数据量大时经常运行较慢(Often slow for large & complicated data)
Matplotlib自2003年发布以来,使用情况还是呈现了良好的趋势:
Matplotlib部分绘图实例如下:
关于matplotlib,微信公众号之前写过一篇关于饼图的介绍,有兴趣的可阅览下。
也因此,后续开发者都吸取了matplotlib库的优点,经过对matplotlib库的缺点进行改进,从而衍生出一系列的可视化库。
基于matplotlib的库概览如下:
下面介绍两个重要的基于matplotlib的第三方库:pandas以及seaborn
Pandas
可能我们平时使用pandas时更多的是用来进行数据分析和处理,其实pandas也提供了较为简单的API来进行图形绘制。
我个人一般是用pandas来处理数据,然后结合其他可视化库(如matplotlib,seaborn,bokeh等)来绘图图形。
Pandas部分绘图实例如下:
微信公众号中部分文章的案例可供参考。
seaborn
Seaborn是基于matplotlib的Python可视化库。它提供了一个高级别接口用于图形绘制。
Seaborn在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图。
关于Searbon,微信公众号之前写过一篇关于热力图的介绍文章,有兴趣的可阅览下。
Seaborn部分绘图实例如下:
详细信息可在其官方网站查阅:
http://seaborn.pydata.org/
基于JavaScript的可视化库
两个受欢迎度较高的可视化库 bokeh 和 plotly
bokeh
Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化Web浏览器,提供非常完美的展示功能。Bokeh 的目标是使用 D3.js样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能。Boken 可以快速的创建交互式的绘图,仪表盘和数据应用。
关于bokeh,微信公众号之前写过的文章用应用过timeseries图,有兴趣的可阅览下。
bokeh部分绘图实例如下:
详细信息可在其官方网站查阅:
http://bokeh.pydata.org
plotly
Plotly是另一个免费进行数据分析和绘制图表的APP,建立在d3.js上。 Plotly图可下载为SVG,EPS或PNG格式,并简单地导入到Illustrator或者Photoshop中。
跟bokeh类似,也可以制作一些交互式的web图。
plotly部分绘图实例如下:
详细内容可以去官网参考:
https://plot.ly/python/
其他综合类型库
Holoviews
Holoviews能够让用户构建有助于可视化的数据结构,而且它包含丰富的可组合元素库,可以覆盖、嵌套和轻松定位。同时,它还支持快速数据探索。
Holoviews可以和Seaborn、pandas或者bokeh组合使用。
由于笔者还没具体了解过Holoviews的使用功能,这里将英文的描述直接放在下面,以免个人理解不准确而产生误导。
关于Holoviews的效果图,可参考下面动态图,建议观看原视频,效果会好点。
Altair
Altairs起源于D3,但代码编写量要比D3简单。这里有两幅对比的图如下:
用D3绘制的柱状图
用Altairs绘制的柱状图
Altair 是 Python 高级声明式可视化库。Altair 提供一个 Python API 在声明式 manner 中构建静态统计可视化库。
什么是声明式可视化库呢,不管是翻译成中文的名称还是看英文的名称,我都一脸懵圈。幸好,有英文的进一步描述,如下:
总的来说,Altairs让开发者们更专注于数据及他们之间的关系,而不是一些不重要的细节。
最后,再放上这张Python可视化的全景图,对于个人而言,不一定能全部熟悉使用,但是能熟练用好其中的一部分,实际应用于工作及项目中,也就OK了。
关于视频
pycon 2017的相关演讲主题的视频在youtube上可观看,由于墙的缘故,部分童鞋可能不能观看视频。
python可视化这个视频,我已经下载下来,需要的童鞋可在微信公众号“Python数据之道”后台回复关键字获取视频,关键字如下:
“2017-024”(不含引号)
相关文章:
Pycon 2017: Python可视化库大全的更多相关文章
- Python可视化库
转自小小蒲公英原文用Python可视化库 现如今大数据已人尽皆知,但在这个信息大爆炸的时代里,空有海量数据是无实际使用价值,更不要说帮助管理者进行业务决策.那么数据有什么价值呢?用什么样的手段才能把数 ...
- python第三方库大全
环境管理 管理 Python 版本和环境的工具 p:非常简单的交互式 python 版本管理工具.官网 pyenv:简单的 Python 版本管理工具.官网 Vex:可以在虚拟环境中执行命令.官网 v ...
- Python常用库大全
环境管理 管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具. pyenv – 简单的 Python 版本管理工具. Vex – 可以在虚拟环境中执行命令. v ...
- Python常用库大全,看看有没有你需要的
作者:史豹链接:https://www.zhihu.com/question/20501628/answer/223340838来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明 ...
- Python应用库大全总结
学python,想必大家都是从爬虫开始的吧.毕竟网上类似的资源很丰富,开源项目也非常多. python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会发生 ...
- Python精选库大全,建议收藏留用!
Python为啥这么火,这么多人学,就是因为简单好学,功能强大,整个社区非常活跃,资料很多.而且这语言涉及了方方面面,比如自动化测试,运维,爬虫,数据分析,机器学习,金融领域,后端开发,云计算,游戏开 ...
- Python可视化库-Matplotlib使用总结
在做完数据分析后,有时候需要将分析结果一目了然地展示出来,此时便离不开Python可视化工具,Matplotlib是Python中的一个2D绘图工具,是另外一个绘图工具seaborn的基础包 先总结下 ...
- python 可视化库
在做titanic分析的过程中,看了一些大神的想法,发现在分析数据的过程中,许多大神会使用到seaborn,plotly这些库,而我等小白仅仅知道matplotlib这个唯一的数据可视化库而已.上网查 ...
- python标准库大全(转)
3. 清晰的标准库大全,带例子 2. 必会标准库 http://lizhenliang.blog.51cto.com/7876557/1872538 1. 标准库大全,链接版 http://blog. ...
随机推荐
- DOM 以及JS中的事件
[DOM树节点] DOM节点分为三大节点:元素节点,文本节点,属性节点. 文本节点,属性节点为元素节点的两个子节点通过getElment系列方法,可以去到元素节点 [查看节点] 1 document. ...
- DirectFB的架构介绍
**************************************************************************************************** ...
- 存储容量和IOPS的关系
在云计算时代,数据量成几何形式增加,必然会考虑增加存储容量,但是增加存储容量不简单存储性能得到提升,他们之间没有必然的联系: 存储容量,就是指存储设备上能够存储数据的大小,比如,一个磁盘阵列有50T的 ...
- Codeforces Round #410 (Div. 2)D题
D. Mike and distribution time limit per test 2 seconds memory limit per test 256 megabytes input sta ...
- ueditor 文件上传的分析和总结
正式开始之前,先写两个常用又容易被我忘掉的文件和流相互转化的方法. 1,文件转流 FileStream fs = new FileStream(filename,FileMode.Open,FileA ...
- 设计模式的征途—6.建造者(Builder)模式
建造者模式又称为生成器模式,它是一种较为复杂.使用频率也相对较低的创建型模式.建造者模式为客户端返回的不是一个简单的产品,而是一个由多个部件组成的复杂产品.因为,没有人买车会只买一个方向盘或者轮胎,大 ...
- 微信创建带参数二维码并加上logo
1.因为带参数二维码有两种,分别是字符参数,数值参数,因此,在写创建方法的时候,需要进行判断 public void ShowQcCode(N_WX_QrCode code) { QRCodeCrea ...
- Archive for required library:xxxxx/spring-beans-3.2.4.RELEASE.jar in project XXXXX cannot be read or is not a valid ZIP file
今天在导入maven项目的时候在problems视图中报错: Archive for required library:xxxxx/spring-beans-3.2.4.RELEASE.jar in ...
- Windows下安装虚拟机和Linux
首先必须开启BIOS中的虚拟化 常见计算机BIOS快捷键: 联想E431 F1dell F2微星 DELETE 默认是开启HP pavilion notebook 15-ab527TX F9和F10m ...
- 一步步学习EF Core(3.EF Core2.0路线图)
前言 这几天一直在研究EF Core的官方文档,暂时没有发现什么比较新的和EF6.x差距比较大的东西. 不过我倒是发现了EF Core的路线图更新了,下面我们就来看看 今天我们来看看最新的EF Cor ...