Numpy - Pandas - Matplot 功能与函数名速查

用Python做数据分析，涉及到的函数实在是太多了，容易忘记，去网上查中文基本上差不到，英文有时候描述不清楚问题。

这里搞个针对个人习惯的函数汇总速查手册，下次需要用一个什么功能，就在这里面查到对应的函数名字，然后取搜索具体用法。随时更新。

Numpy

创建：

创建一个随机数组x*y:

np.empty(x,y)

产生随机数组，产生指定大小随机数组，指定范围随机数组，均匀分布，数组元素在0到1之间

np.random.uniform(0,100,size=5)

-----------Pandas----------

Series

判断是否是唯一的值:

obj.unique()

统计值：

obj.value_counts()

DataFrame:

根据一个列或者多个列进行排序

frame.sort_values(by=['a','b'])

删除列/删除行

del frame['a']

del frame[3]

对整个表应用操作f

frame.apply(f)

对列进行重新排序/重排：

frame.colomns = ['b','c','a']

对每列求和

frame.sum()

对每行求和

frame.sum(axis=1)

求累计和，就是加上前几行的数据的总和

frame.cumsum()

求每列最大值的索引

frame.idxmax() 返回索引

frame.argmax() 返回一个整数值

求每行最大值的索引

frame.idxmax(axis=1)

对每一列进行汇总统计(包括计数/均值/方差/最小值/分位点/最大值)

frame.describe()

缺失数据/缺失处理：

删除缺失数据(NaN)：

丢掉数据：dropna

只丢掉全为空的列: data.dropna(axis=1,how='all')

用指定值填充：fillna

对每个位置判断有无缺失: isnull , notnull

填充缺失数据（NaN）：

用指定值填充：

data.fiina(1)

用平均值填充：

data.fillna(data.mean())

修改列名

df=df.rename(columns = {'two':'new_name'})

Numpy - Pandas - Matplot 功能与函数名速查的更多相关文章

Netsuite Formula > Oracle函数列表速查(PL/SQL单行函数和组函数详解).txt
PL/SQL单行函数和组函数详解函数是一种有零个或多个参数并且有一个返回值的程序.在SQL中Oracle内建了一系列函数,这些函数都可被称为SQL或PL/SQL语句,函数主要分为两大类: 单行函数 ...
123_Power Pivot&Power BI DAX函数说明速查
博客:www.jiaopengzi.com 焦棚子的文章目录请点击下载附件说明 1.基于DAX Studio 2.9.2版本导出整理: 2.DAX Studio网站,及时更新下载,DAX学习利器: ...
numpy, pandas, scikit-learn cheat sheet (速查表)
1. scikit-learn cheat sheet 官方链接如下:http://scikit-learn.org/stable/tutorial/machine_learning_map/ Oft ...
用trie树实现输入提示功能，输入php函数名，提示php函数
参照刘汝佳的trie树结构体 #include "stdio.h" #include "stdlib.h" #include "string.h&q ...
python 数据分析工具之 numpy pandas matplotlib
作为一个网络技术人员,机器学习是一种很有必要学习的技术,在这个数据爆炸的时代更是如此. python做数据分析,最常用以下几个库 numpy pandas matplotlib 一.Numpy库为了 ...
有关python numpy pandas scipy 等能在YARN集群上运行PySpark
有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...
三、Pandas速查手册中文版
本文翻译自文章:Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解. 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重 ...
pandas 之 groupby 聚合函数
import numpy as np import pandas as pd 聚合函数 Aggregations refer to any data transformation that produ ...
【转】Pandas速查手册中文版
本文翻译自文章:Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解. 对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重 ...

随机推荐

binary 和 varbinary 用法全解
在SQL Server中,使用数据类型 binary(n) 和 varbinary(n) 存储二进制数据,n是指字节数量: binary(n):固定长度为 n 字节,其中 n 值从 1 到 8,000 ...
Visual Studio控制台程序输出窗口一闪而过的解决方法
转载大牛的博客,自己也遇到了类似的问题,解决方法很详细,也很管用刚接触 Visual Studio的时候大多数人会写个Hello World的程序试一下,有的人会发现执行结束后输出窗口会一闪而过 ...
用Micro:bit做交通信号灯
交通信号灯项目在控制技术中,有点像"Hello world!" 是一个入门级的范例. 对于孩子来说,交通灯跟日常生活息息相关,他们都熟悉,充分知道需要做什么这是一个让孩子开始的好项 ...
当activity改变时，我们如何处理它
用户和系统触发的事件,可能造成一个activity状体的改变.这个文档描述了一些常见的情况,和如何去处理这些改变. 原网站:https://developer.android.google.cn/g ...
数据中心网络（1）-VXLAN
想写个DC系列的文章,站在传统路由交换网络基础上谈谈数据中心网络,一方面是给自己的学习做下总结,另一方面也想分享一些东西. 谈到数据中心网络,能想到的东西无非就VXLAN.SDN.NFV.EVPN这些 ...
kubeadm安装kubernetes 1.13.1集群完整部署记录
k8s是什么 Kubernetes简称为k8s,它是 Google 开源的容器集群管理系统.在 Docker 技术的基础上,为容器化的应用提供部署运行.资源调度.服务发现和动态伸缩等一系列完整功能,提 ...
Beta阶段展示博客
Beta阶段展示博客 1. 团队成员的简介和个人博客地址刘畅博客园ID:森高Slontia 身份:PM 个人介绍: 弹丸粉 || 小说创作爱好者 || 撸猫狂魔(x || 生命的价值在于创造 (我 ...
Linux内核分析——第八周学习笔记
实验作业:进程调度时机跟踪分析进程调度与进程切换的过程 20135313吴子怡.北京电子科技学院 [第一部分]理解Linux系统中进程调度的时机 1.Linux的调度程序是一个叫schedule()的 ...
oracle union
union 取并集,去重不仅去掉两个集合之间的重复,也会去掉集合的自重复
Daily Scrum - 11/16
时间:午饭今天小组例会主要是汇报了各自的进度.任烁那边主要为工程添加了单词的类(包含各个参数等成员变量),方便以后实现算法:拜重阳实现了一个简易的“点进-点出”UI,可谓迈出了艰难的第一步:章玮和罗 ...

Numpy - Pandas - Matplot 功能与函数名 速查

Numpy - Pandas - Matplot 功能与函数名 速查的更多相关文章

随机推荐

热门专题

Numpy - Pandas - Matplot 功能与函数名速查

Numpy - Pandas - Matplot 功能与函数名速查的更多相关文章