直方图用于展示数据的分布情况,x轴是一个连续变量,y轴是该变量的频次. 下面利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://datasets.flowingdata.com/crimeRatesByState2005.csv 以下是这个数据文件的前5行: state murder forcible_rape robbery aggravated_assault \ 0 United States 5.6 31.7 140.7 291…
由于直方图受组距(bin size)影响很大,设置不同的组距可能会产生完全不同的可视化结果.因此我们可以用密度平滑估计来更好地反映数据的真实特征.具体可参见这篇文章:https://blog.csdn.net/unixtch/article/details/78556499. 还是用我们自己创建的一组符合正态分布的数据来画图. 准备工作:先导入matplotlib,seaborn和numpy,然后创建一个图像和一个坐标轴 import numpy as np from matplotlib im…
箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)分别为数据的第25%,50%和75%的数字. I-------------I o I-------------I o I-------------I o I-------------I Q1                Q2                 Q3 (lower quartile) …
conda  install seaborn  是安装到jupyter那个环境的 1. 整体风格设置 对图表整体颜色.比例等进行风格设置,包括颜色色板等调用系统风格进行数据可视化 set() / set_style() / axes_style() / despine() / set_context() import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns % ma…
系统自带的数据表格(存放在github上https://github.com/mwaskom/seaborn-data),使用时通过sns.load_dataset('表名称')即可,结果为一个DataFrame. print(sns.get_dataset_names()) #获取所有数据表名称 # ['anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'exercise', 'flight…
这里利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://datasets.flowingdata.com/us-postage.csv 准备工作:先导入matplotlib和pandas,用pandas读取csv文件,然后创建一个图像和一个坐标轴 import pandas as pd from matplotlib import pyplot as plt postage=pd.read_csv(r"http://datas…
这里利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://book.flowingdata.com/ch05/data/us-population-by-age.xls 准备工作:先导入matplotlib和pandas,用pandas读取excel文件,然后创建一个图像和一个坐标轴 import pandas as pd from matplotlib import pyplot as plt population=pd.read_ex…
这里利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://datasets.flowingdata.com/ppg2008.csv 首先查看一下数据文件的前5行: Name G MIN PTS FGM FGA FGP FTM FTA FTP ... \ 0 Dwyane Wade 79 38.6 30.2 10.8 22.0 0.491 7.5 9.8 0.765 ... 1 LeBron James 81 37.7 28.4 9.7 1…
这里利用Jake Vanderplas所著的<Python数据科学手册>一书中的数据,学习画图. 数据地址:https://raw.githubusercontent.com/jakevdp/data-CDCbirths/master/births.csv 准备工作:先导入matplotlib和pandas,用pandas读取csv文件,然后创建一个图像和一个坐标轴 import pandas as pd from matplotlib import pyplot as plt birth=p…
矩阵图非常有用,人们经常用它来查看多个变量之间的联系. 下面用著名的鸢尾花数据来画一个矩阵图.从sklearn导入鸢尾花数据,然后将其转换成pandas的DataFrame类型,最后用seaborn画图.(seaborn包里也有这个数据,也可以直接从seaborn包导入此数据) 矩阵图: sns.pairplot(data,hue=...)   ---   hue为data里的数据,用其来显示不同颜色 由于data需要的格式为每列是变量(在这里是鸢尾花的四个特征),每行则是各变量的观测数据,因此…
当我们学习python的时候,总会用到一些常用的模块,接下来我就详细讲解下利用两种不同的方式画饼状图.首先利用[Tkinter]中的canvas画布来画饼状图: from tkinter import Tk, Canvasdef DrawPie(): #创建窗口 windows=Tk() #添加标题 windows.title("画饼图") # 设置画布样式 canvas=Canvas(windows,height=500,width=500) # 将画布打包到窗口 canvas.pa…
当我们在绘制散点图的时候,可能会遇到点特别多的情况,这时点与点之间过度重合,影响我们对图的认知.为了更好地反映特征,我们可以加上点的密度信息,比如在原来散点所在的位置将密度用热图的形式呈现出来,再比如在主图的边缘加上直方图等来反映密度.具体实现如下: 先导入数据,除了ggplot2,还有一个ggExtra包 library(ggplot2) library(tidyverse) library(ggExtra) df=read.table("20191126P31_HTODemux_CiteFu…
雷达图常用于对多项指标的全面分析.例如:HR想要比较两个应聘者的综合素质,用雷达图分别画出来,就可以进行直观的比较. 用Matplotlib画雷达图需要使用极坐标体系,可点击此链接,查看对极坐标体系的介绍:https://www.cnblogs.com/kallan/p/6738577.html. 下面,我们从五个方面(编程能力,沟通技能,专业知识,团队协作,工具掌握)来对路人甲和路人乙进行比较. 代码如下: import numpy as np from matplotlib import p…
误差线用于显示数据的不确定程度,误差一般使用标准差(Standard Deviation)或标准误差(Standard Error). 标准差(SD):是方差的算术平方根.如果是总体标准差,那么用σ表示,如果是样本标准差,那么用s表示.标准差反映数据集的离散程度,标准差越小,就说明数据越集中在其平均值附近.公式:(总体),(样本)     标准误差(SE):是样本分布的标准差.如果是样本平均数分布的标准差,那么就称为SEM(standard error of the mean),就是说每次从总体…
我在网上随便找了一组数据,用它来学习画图.大家可以直接把下面的数据复制到excel里,然后用pandas的read_excel命令读取.或者直接在脚本里创建该数据. 饼图: ax.pie(x,labels=...,explode=...) 代码如下: import numpy as np import matplotlib from matplotlib import pyplot as plt matplotlib.rcParams['font.sans-serif']='Microsoft…
有时我们不仅需要查看单个变量的分布,同时也需要查看变量之间的联系,这时就需要用到联合分布图. 这里利用Jake Vanderplas所著的<Python数据科学手册>一书中的数据,学习画图. 数据地址:http://raw.githubusercontent.com/jakevdp/marathon-data/master/marathon-data.csv 先来看一下这个数据文件(此处只摘取部分): age gender split final 0 33 M 01:05:38 02:08:5…
在机器学习中,经常要用scikit-learn里面的线性回归模型来对数据进行拟合,进而找到数据的规律,从而达到预测的目的.用图像展示数据及其拟合线可以非常直观地看出拟合线与数据的匹配程度,同时也可用于后续的解释和阐述工作. 这里利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://datasets.flowingdata.com/unemployment-rate-1948-2010.csv 准备工作:先导入matplotlib和pand…
Matplotlib里有两种画散点图的方法,一种是用ax.plot画,一种是用ax.scatter画. 一. 用ax.plot画 ax.plot(x,y,marker="o",color="black") 二. 用ax.scatter画 ax.scatter(x,y,marker="o",s=sizes,c=colors) ax.plot和ax.scatter的区别: ax.plot:各散点彼此复制,因此整个数据集中所有的点只需配置一次颜色和大小…
这里利用Nathan Yau所著的<鲜活的数据:数据可视化指南>一书中的数据,学习画图. 数据地址:http://datasets.flowingdata.com/hot-dog-contest-winners.csv (用于普通柱形图) http://datasets.flowingdata.com/hot-dog-places.csv (用于堆积柱形图和横向柱形图) 准备工作:先导入matplotlib和pandas,用pandas读取csv文件,然后创建一个图像和一个坐标轴 import…
画词云首先需要安装wordcloud(生成词云)和jieba(中文分词). 先来说说wordcloud的安装吧,真是一波三折.首先用pip install wordcloud出现错误,说需要安装Visual C++ 14.0.折腾半天安装好Visual C++后,还是不行,按网上指点,下载第三方包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud).安装是成功了,可是在anaconda里导入的时候又出现了问题,说是"no module…
mplot3d是matplotlib里用于绘制3D图形的一个模块.关于mplot3d 绘图模块的介绍请见:https://blog.csdn.net/dahunihao/article/details/77833877. 莫比乌斯环(mobius strip)是一种只有一个曲面的拓扑结构.把一个纸条扭转180°后,两头再粘接起来,这样的纸带只有一个面(即单侧曲面),一只小虫可以爬遍整个曲面而不必跨过它的边缘. 莫比乌斯环是一个二维的紧致流形 (即一个有边界的面),可以嵌入到三维或更高维的流形中…
(一)误差棒图----误差置信区间的表示 import matplotlib.pyplot as plt import numpy as np x = np.linspace(0.1, 0.6, 10) y = np.exp(x) error = 0.05 + 0.15*x lower_error = error upper = 0.3*error error_limit = [lower_error, upper] plt.errorbar(x, y, yerr=error_limit, fm…
所用的函数非常简单,只需要用到mesh函数,示例代码如下: Ima=imread('F:\pathto\test.jpg'); surf_ima = surf(rgb2gray(Ima)); %黑色的3D图 title('3D') mesh_ima = mesh(rgb2gray(Ima)); %有色彩的3D图 参考链接:https://cn.mathworks.com/matlabcentral/answers/17998-image-processing-how-can-i-create-a…
Matplotlib有两种接口,一种是matlab风格接口,一种是面向对象接口.在这里,统一使用面向对象接口.因为面向对象接口可以适应更复杂的场景,在多图之间进行切换将变得非常容易. 首先导入matplotlib:from matplotlib import pyplot as plt.plt是最常用的接口. 一. 创建图像和坐标轴 fig=plt.figure()   ---   创建图像 ax=plt.axes()   ---   创建坐标轴 在matplotlib中,可以把figure看成…
matplotlib 是Python下的一个高质量的画图库,可以简单的类似于MATLAB方法构建高质量的图表. 原始文章地址:http://zanyongli.i.sohu.com/blog/view/195717824.htm 学习心得: 笔记参照<用Python做科学计算>的matplotlib部分. 凡例:a. [float]表示对象类型是float,用时不用加'['和']'.b. 代码中的跳格表示换行. Chap 5 matplotlib-绘制精美的图表 1. artist对象的set…
原   matplotlib学习笔记 参考:Python数据科学入门教程 Python3.6.1 jupyter notebook .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px solid #000; } .table { border-collapse: collapse !important; } .table td, .table th { backg…
学习完matplotlib绘图可以设置的属性,还需要学习一下除了折线图以外其他类型的图如直方图,条形图,散点图等,matplotlib还支持更多的图,具体细节可以参考官方文档:https://matplotlib.org/gallery/index.html 折线图 折线图主要是以折线的上升或者下降表示数据的增减 plt.plot() 调用多次可以在同一张图上绘制多条折线 x = range(11,31,1) a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,…
matplotlib 学习总结 作者:csj更新时间:01.09 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结: 回主目录:2017 年学习记录和总结 # matplotlib 及环境配置 # 数据图的组成结构,与 matplotlib 对应的名称 # 常见的数据绘图类型,与绘制方法 # 您可能需要以下的准备与先修知识: # Python开发环境及matplotlib工具包 # Python基础语法 # Python numpy 包使用 # 一幅数据图…
之前学习了matplotlib的一些基本画图方法(查看上一节),这次主要是学习在图中加一些文字和其其它有趣的东西. 先来个最简单的图 from matplotlib import pyplot as plt import numpy as np x = np.linspace(-2, 2, 50) y = x**2 plt.xlim((-3,3))#设置x坐标范围 plt.ylim((0,5))#设置y坐标范围 plt.plot(x,y) plt.show() 接下来加一下文字描述,第一种方法,…
原  Matplotlib学习笔记 参考:Python数据科学入门教程 Python3.6.1 jupyter notebook .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px solid #000; } .table { border-collapse: collapse !important; } .table td, .table th { backgr…