python学习 —— seaborn、matplotlib、pandas、numpy package的混合使用
这里使用了Titanic Machine learning数据集,然后通过Seaborn的函数来拟合和绘制回归线,matplotlib进行可视化。
先来一个简单的测试:
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns df = pd.read_csv('../test.csv', index_col=0) # 读取csv表格, index_col=0表示第0列为id
print(df.head(n=5)) # 打印前5行的数据 # sns.lmplot(x='Age', y='Fare', data=df)
sns.jointplot(x='Age', y='Fare', data=df) # 去掉以下两句代码可发现原点不在最左下角
plt.ylim(0, None)
plt.xlim(0, None)
plt.show() # 可视化
运行结果:

sns.lmplot(x='Age', y='Fare', data=df):

使用sns.jointplot(x='Age', y='Fare', data=df) # 默认为条形图:

sns.jointplot(x='Age', y='Fare', data=df, kind='kde',) # 上右两边的就变为了条形:

我发现python3貌似不能用 pd + plt 实现堆积柱状图:
import pandas as pd
from matplotlib import pyplot as plt df = pd.read_csv('../train.csv', index_col=0) # 读取csv表格, index_col=0表示第0列为id
print(df.describe()) survived_0 = df.Age[df.Survived == 0].value_counts()
survived_1 = df.Age[df.Survived == 1].value_counts() print(survived_0)
print(survived_1) df = pd.DataFrame({'Death': survived_0, 'Survival': survived_1})
df.plot(kind='bar',) # 条形 plt.title('View by Age')
plt.xlabel('Age')
plt.ylabel('Density') plt.show()
运行结果:
将df.plot(kind='bar')改为
df.plot(kind='kde',) # 曲线
运行结果:

这样也不错:
g = sns.jointplot(x='Survived', y='Fare', data=df, kind='kde',) g.plot_joint(plt.scatter, c="w", s=30, linewidth=1, marker="+")
g.ax_joint.collections[0].set_alpha(0)
运行结果:
sns.load_dataset()是调用官网github网站中的数据集或者安装包时下载到本地的数据集:

不出我意料的有titanic,于是使用之:
sns.set(style="ticks", color_codes=True)
titanic = sns.load_dataset('titanic', cache=False) # 看底层代码,设置cache为False就不用联网去找了
g = sns.pairplot(titanic, hue="age",) # hue不能传入'survivde' 记得都是小写 plt.show()
数据较多 运行有点慢、有点卡 = =:

未完待续。。。
python学习 —— seaborn、matplotlib、pandas、numpy package的混合使用的更多相关文章
- Python之(matplotlib、numpy、pandas)数据分析
一.Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形. 它主要用来回事图形,用来展现一些数据,更加直观的展示,让你第一眼就只要数 ...
- 【Python学习之十一】Numpy
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 python3.6 1.介绍NumPy(Numerical Pyt ...
- Python学习教程:Pandas中第二好用的函数
从网上看到一篇好的文章是关于如何学习python数据分析的迫不及待想要分享给大家,大家也可以点链接看原博客.希望对大家的学习有帮助. 本次的Python学习教程是关于Python数据分析实战基础相关内 ...
- Python学习-使用matplotlib画动态多图
最近常常使用matplotlib进行数学函数图的绘制,可是怎样使用matplotlib绘制动态图,以及绘制动态多图.直到今天才学会. 1.參考文字 首先感谢几篇文字的作者.帮我学会了怎样绘制.大家也能 ...
- Python学习总结 05 pandas
pandas官方网址 : http://pandas.pydata.org/ . pandas的安装比较复杂,如果想开箱即用,可以考虑下载WinPython.WinPython的官方地址是: htt ...
- 【Python学习】matplotlib的颜色
matplotlib自带的颜色 seaborn的颜色 装了seaborn扩展的话,在字典seaborn.xkcd_rgb中包含所有的xkcd crowdsourced color names. 使用的 ...
- 【Python学习笔记】Pandas库之DataFrame
1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matla ...
- python大数据初探--pandas,numpy代码示例
import pandas as pd import numpy as np dates = pd.date_range(',periods=6) dates import pandas as pd ...
- 2019-04-15 Python之利用matplotlib和numpy的简单绘图
环境:win10家庭版, Anocada的 Spyder 一.简单使用 使用函数 plt.polt(x,y,label,color,width) 根据x,y 数组 绘制直,曲线 import nump ...
随机推荐
- 01-书城http状态405-此url不支持http方法get
错误: http状态405-此url不支持http方法get 原因:
- Spring_002 依赖注入方式实现
继续写我们的第一个Spring程序,这次我们使用依赖注入的方式实现程序 第一步,建立我们的Spring_002程序,并在程序中添加BookDao.java.BookDaoImpl.java.BookS ...
- HDU 1312 Red and Black(经典DFS)
嗯... 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1312 一道很经典的dfs,设置上下左右四个方向,读入时记下起点,然后跑dfs即可...最后答 ...
- css实现单行和多行省略号
1.单行省略 { width:300px; overflow: hidden; text-overflow:ellipsis; whitewhite-space: nowrap; } 注:单行省略必须 ...
- P1432
这个题是一个很简单的等比数列. 题目大意是:初始第一步 $ n_1 = 2 $,之后的每一步都比前一步减少 98%,即满足等比数列 $ 2 + 2 \times 0.98 + 2 \times 0.9 ...
- Javascript——(1)
1.Javascript有两种解释表示形式:1)在html的<header>中写<script><script/>,另一种是将另一个文件保存为xxx.js文档,然后 ...
- 增加phpmyadmin导入文件上限
一.修改php配置 修改php配置文件,php.ini upload_max_filesize = 100M post_max_size = 100M 一般修改这2个就行了,然后重启wampserve ...
- 单播反向路径转发uRPF
uRPF将数据包的源地址和存储在转发信息库(FIB)中的信息进行对照,以判定数据包的合法性.FIB是Cisco CEF技术中的一张表,包含从路由表中复制过来的转发信息,可以将其视为路由表的镜像,FIB ...
- C语言-断言
1 作用: 断言常做语言处理的高级形式,自动处理软件隐藏很深其且它手段不易发现的错误,快速进行异常定位.同时这也是软件单元测试必须的技术. 2 使用范围: 2.1放在函数入口对入口参数进行合法性检查( ...
- C语言-调试
1 格式化输出函数printf("%d %s",a,str):格式化控制符之间不能有“逗号”,可以用空格 1.1格式化输入函数scanf(“%d”,t)格式化控制符之间不能有空格 ...