Python数据科学手册-Pandas:层级索引
一维数据 和 二维数据 分别使用Series 和 DataFrame 对象存储。
多维数据:数据索引 超过一俩个 键。
Pandas提供了Panel 和 Panel4D对象 解决三维数据和四维数据。
实践中,更直观的形式是通过 层级索引(Hierarchical indexing, 多级索引 = 》 muti-indexing)
配合 多个不同 等级的一级索引 一起使用。
本节介绍 MultiIndex对象的使用,以及 普通索引 与 层级索引的转换
多级索引Series
- 笨方法

- 好方法: MultiIndex
上面的笨方法 是用元组来表示索引 就是 多级索引的基础。
可以用元组创建一个多级索引

levels 属性表示索引的等级 。
前面的 Series对象 使用索引重置(reindex)就转换为MultiIndex

切片获取 2010 年的数据

- 高维数据的多级索引
可以使用一个带行 列 索引的 简单DataFrame 代替前面的多级索引。
unstack()方法可以快速将一个多级索引的Series 转换为普通索引的DataFrame.

stack()方法 反过来

why:
可以使用含多级索引的一维Series 表示 二维数据,
就可以使用
Series 或DataFrame 表示 三维 甚至更高维度的数据。
多级索引 每 增加 以及,就表示数据增加一维。
比如:增加一列显示每一年 各州的人口统计指标。
对于带有MultiIndex的对象。增加一列,就和DataFrame一样简单。

多级索引创建方法
为Series 和 DataFrame 创建多级索引 最 直接 的办法就是将index参数设置为至少 二维的索引数组。

同理,将元组作为键的字典传递给Pandas, Pandas也会默认转换为MultiIndex
显示的创建多级索引
- 一个不同等级的若干简单数组组成的列表来构见MultiIndex

2) 包含多个索引值得元组构成的列表

3) 俩个索引的笛卡尔积

4)直接提供levels ,注意老版本是labels,新版本是code了。

在创建Series 或 DataFrame时,可以将这些对象作为index参数。 或者通过reindex方法更新Series/DataFrame.
多级索引的等级名称

多级列索引
行与列是对称的。

多级索引的取值与切片
1)Series多级索引
单个元素

局部取值

局部切片

较低层级的索引

布尔掩码

花哨索引

2)DataFrame多级索引
DataFrame的基本索引是列索引。



传递多个层级的索引元组


2022年5月31日23:18:51
多级索引行列转换
1) 有序的索引和无序的索引
如果MultiIndex不是有序的索引,那么大多数切片操作都会失败。
局部切片要求MultiIndex各级索引 有序。 按照字典序。


索引排序。 sort_index() sortlevel()


- 索引stack与unstack
unstack 将一个多级的索引数据 转为 简单的二维形式, level 设置转换的索引层级。

levle=1

stack是unstack的逆操作。
3)索引的设置 与 重置
层级数据维度转换的另一种方法是 行列标签转换。
可以通过reset_index方法实现。
Series中使用该方法, 会生成一个列标签中包含之前行索引 标签的state 和 year的 DataFrame.

set_index 逆操作。

多级索引的数据累计方法
可以设置参数 level实现对数据子集的累计操作。

增加axis参数。就可以累计了

Python数据科学手册-Pandas:层级索引的更多相关文章
- Python数据科学手册-Pandas:累计与分组
简单累计功能 Series sum() 返回一个 统计值 DataFrame sum.默认对每列进行统计 设置axis参数,对每一行 进行统计 describe()可以计算每一列的若干常用统计值. 获 ...
- Python数据科学手册-Pandas:向量化字符串操作、时间序列
向量化字符串操作 Series 和 Index对象 的str属性. 可以正确的处理缺失值 方法列表 正则表达式. Method Description match() Call re.match() ...
- Python数据科学手册-Pandas:数值运算方法
Numpy 的基本能力之一是快速对每个元素进行运算 Pandas 继承了Numpy的功能,也实现了一些高效技巧. 对于1元运算,(函数,三角函数)保留索引和列标签 对于2元运算,(加法,乘法),Pan ...
- Python数据科学手册-Pandas:数据取值与选择
Numpy数组取值 切片[:,1:5], 掩码操作arr[arr>0], 花哨的索引 arr[0, [1,5]],Pandas的操作类似 Series数据选择方法 Series对象与一维Nump ...
- Python数据科学手册-Pandas数据处理之简介
Pandas是在Numpy基础上建立的新程序库,提供了一种高效的DataFrame数据结构 本质是带行标签 和 列标签.支持相同类型数据和缺失值的 多维数组 增强版的Numpy结构化数组 行和列不在只 ...
- Python数据科学手册-Pandas:合并数据集
将不同的数据源进行合并 , 类似数据库 join merge . 工具函数 concat / append pd.concat() 简易合并 合并高维数据 默认按行合并. axis=0 ,试试 axi ...
- 100天搞定机器学习|day45-53 推荐一本豆瓣评分9.3的书:《Python数据科学手册》
<Python数据科学手册>共五章,每章介绍一到两个Python数据科学中的重点工具包.首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境:第2章讲解能提供nda ...
- Python数据科学手册
Python数据科学手册(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1KurSdjNWiwMac3o3iLrzBg 提取码:qogy 复制这段内容后打开百度网盘手 ...
- Matplotlib 使用 - 《Python 数据科学手册》学习笔记
一.引入 import matplotlib as mpl import matplotlib.pyplot as plt 二.配置 1.画图接口 Matplotlib 有两种画图接口: (1)一个是 ...
随机推荐
- 强化学习-学习笔记7 | Sarsa算法原理与推导
Sarsa算法 是 TD算法的一种,之前没有严谨推导过 TD 算法,这一篇就来从数学的角度推导一下 Sarsa 算法.注意,这部分属于 TD算法的延申. 7. Sarsa算法 7.1 推导 TD ta ...
- 2018 CSP-J 初赛解析
做题记录与答案 今天这个做的是真的烂,60分,妙极了(微笑 可以看看人家的解析 选择: 选择好多不太懂的,一个个的来解析 先分析一下选择的知识点: 计算机基础 :T1.T3.T4.T5.T8 进制转换 ...
- 4 zookeeper集群和基本命令
4 zookeeper集群和基本命令 集群思路:先搞定一台服务器,再克隆出两台,形成集群! 1 安装zookeeper 我们的zookeeper是安装在/opt目录下 2 配置服务器编号 在/opt/ ...
- Solution -「ABC 217」题解
D - Cutting Woods 记录每一个切割点,每次求前驱后驱就好了,注意简单判断一下开闭区间. 考场上采用的 FHQ_Treap 无脑莽. #include <cstdio> #i ...
- kubernetes下kubelet无法启动
错误如下: 09:58:45 kubernetes-node01 kubelet[6248]: F0124 09:58:45.902571 6248 server.go:265] failed to ...
- Hadoop-HA 搭建高可用集群Hadoop Zookeeper
Hadoop Zookeeper 搭建(一) 一.准备工作 VMWARE虚拟机 CentOS 7 系统 虚拟机1:master 虚拟机2:node1 虚拟机3:node2 时间同步 ntpdate n ...
- Codeforces 缺省源
#include <cstdio> #include <algorithm> #include <vector> using namespace std; type ...
- 算法竞赛进阶指南 0x43 线段树
目录 线段树简介 线段树的简单代码实现 建树代码 修改操作 查询操作 线段树的查询操作的时间复杂度分析: AcWing245. 你能回答这些问题吗 思路 代码[时间复杂度:\(O( \space(N+ ...
- ASP.NET Core 6.0 基于模型验证的数据验证
1 前言 在程序中,需要进行数据验证的场景经常存在,且数据验证是有必要的.前端进行数据验证,主要是为了减少服务器请求压力,和提高用户体验:后端进行数据验证,主要是为了保证数据的正确性,保证系统的健壮性 ...
- jsx/tsx使用cssModule和typescript-plugin-css-modules
目录 1,前言 2,效果图 3,如何使用 3.1,安装 3.2,配置 4,示例 5,插件错误处理 5.1,错误触发原因 5.2,解决办法 1,前言 在vite/webpack搭建的项目中,不管是vue ...