pandas功能使用rename, reindex, set_index 详解
pandas rename 功能
- 在使用 pandas 的过程中经常会用到修改列名称的问题,会用到 rename 或者 reindex 等功能,每次都需要去查文档
- 当然经常也可以使用 df.columns重新赋值为某个列表
- 用 rename 则可以轻松应对 pandas 中修改列名的问题
导入常用的数据包
import pandas as pd
import numpy as np
构建一个 含有multiIndex的 Series
arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
s = pd.Series(np.random.randn(8), index=index)
s.index
MultiIndex(levels=[['bar', 'baz', 'foo', 'qux'], ['one', 'two']],
labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]],
names=['first', 'second'])
查看 s
s
first second
bar one -0.073094
two -0.449141
baz one 0.109093
two -0.033135
foo one 1.315809
two -0.887890
qux one 2.255328
two -0.778246
dtype: float64
使用set_names可以将 index 中的名称进行更改
s.index.set_names(['L1', 'L2'], inplace=True)
s
L1 L2
bar one 0.037524
two -0.178425
baz one -0.778211
two 1.440168
foo one 0.314172
two 0.710597
qux one 1.197275
two 0.527058
dtype: float64
s.index
MultiIndex(levels=[['bar', 'baz', 'foo', 'qux'], ['one', 'two']],
labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]],
names=['L1', 'L2'])
同样可以使用 rename 将Series 修改回来
s.index.rename(['first','second'],inplace= True)
s
first second
bar one 0.037524
two -0.178425
baz one -0.778211
two 1.440168
foo one 0.314172
two 0.710597
qux one 1.197275
two 0.527058
dtype: float64
使用reset_index 可以将 index 中的两列转化为正常的列
s.reset_index()
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| first | second | 0 | |
|---|---|---|---|
| 0 | bar | one | 0.037524 |
| 1 | bar | two | -0.178425 |
| 2 | baz | one | -0.778211 |
| 3 | baz | two | 1.440168 |
| 4 | foo | one | 0.314172 |
| 5 | foo | two | 0.710597 |
| 6 | qux | one | 1.197275 |
| 7 | qux | two | 0.527058 |
可以使用 pivot_table 恢复成一开始的样子,将两列重新作为 index 展示出来
s.reset_index().pivot_table(index=['first','second'],values=0,aggfunc=lambda x:x)
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| 0 | ||
|---|---|---|
| first | second | |
| bar | one | 0.037524 |
| two | -0.178425 | |
| baz | one | -0.778211 |
| two | 1.440168 | |
| foo | one | 0.314172 |
| two | 0.710597 | |
| qux | one | 1.197275 |
| two | 0.527058 |
同样可以使用最简单的方式进行更改 index 中的名称
s.index.names=['first1','second1'] ## 此操作,相当于直接赋值,会更改 s
s.index
MultiIndex(levels=[['bar', 'baz', 'foo', 'qux'], ['one', 'two']],
labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]],
names=['first1', 'second1'])
s
first1 second1
bar one 0.037524
two -0.178425
baz one -0.778211
two 1.440168
foo one 0.314172
two 0.710597
qux one 1.197275
two 0.527058
dtype: float64
df = pd.DataFrame({'A' : ['one', 'one', 'two', 'three'] * 3, 'B' : ['A', 'B', 'C'] * 4,
'C' : ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'] * 2,
'D' : np.random.randn(12),
'E' : np.random.randn(12)})
df.head()
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| A | B | C | D | E | |
|---|---|---|---|---|---|
| 0 | one | A | foo | 0.664180 | -0.107764 |
| 1 | one | B | foo | -0.833609 | 0.008083 |
| 2 | two | C | foo | 0.117919 | -1.365583 |
| 3 | three | A | bar | -0.116776 | -1.201934 |
| 4 | one | B | bar | -1.315190 | -0.157779 |
df.pivot_table(index=['A','C'],values=['D'],columns='B',aggfunc=np.sum,fill_value='unknown')
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead tr th {
text-align: left;
}
.dataframe thead tr:last-of-type th {
text-align: right;
}
| D | ||||
|---|---|---|---|---|
| B | A | B | C | |
| A | C | |||
| one | bar | 2.71452 | -1.31519 | 0.0231296 |
| foo | 0.66418 | -0.833609 | -0.96451 | |
| three | bar | -0.116776 | unknown | 0.450891 |
| foo | unknown | 0.012846 | unknown | |
| two | bar | unknown | 0.752643 | unknown |
| foo | 0.963631 | unknown | 0.117919 | |
df1 =df.pivot_table(index=['A','C'],values=['D'],columns='B',aggfunc=np.sum,fill_value='unknown')
df1.index
MultiIndex(levels=[['one', 'three', 'two'], ['bar', 'foo']],
labels=[[0, 0, 1, 1, 2, 2], [0, 1, 0, 1, 0, 1]],
names=['A', 'C'])
df1.index.names=['first','second']
df1
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead tr th {
text-align: left;
}
.dataframe thead tr:last-of-type th {
text-align: right;
}
| D | ||||
|---|---|---|---|---|
| B | A | B | C | |
| first | second | |||
| one | bar | 2.71452 | -1.31519 | 0.0231296 |
| foo | 0.66418 | -0.833609 | -0.96451 | |
| three | bar | -0.116776 | unknown | 0.450891 |
| foo | unknown | 0.012846 | unknown | |
| two | bar | unknown | 0.752643 | unknown |
| foo | 0.963631 | unknown | 0.117919 | |
df1_stack=df1.stack()
df1_stack.index.names=['first','second','third']
df1_stack
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| D | |||
|---|---|---|---|
| first | second | third | |
| one | bar | A | 2.71452 |
| B | -1.31519 | ||
| C | 0.0231296 | ||
| foo | A | 0.66418 | |
| B | -0.833609 | ||
| C | -0.96451 | ||
| three | bar | A | -0.116776 |
| B | unknown | ||
| C | 0.450891 | ||
| foo | A | unknown | |
| B | 0.012846 | ||
| C | unknown | ||
| two | bar | A | unknown |
| B | 0.752643 | ||
| C | unknown | ||
| foo | A | 0.963631 | |
| B | unknown | ||
| C | 0.117919 |
df1_stack.columns=['总和']
df1_stack
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| 总和 | |||
|---|---|---|---|
| first | second | third | |
| one | bar | A | 2.71452 |
| B | -1.31519 | ||
| C | 0.0231296 | ||
| foo | A | 0.66418 | |
| B | -0.833609 | ||
| C | -0.96451 | ||
| three | bar | A | -0.116776 |
| B | unknown | ||
| C | 0.450891 | ||
| foo | A | unknown | |
| B | 0.012846 | ||
| C | unknown | ||
| two | bar | A | unknown |
| B | 0.752643 | ||
| C | unknown | ||
| foo | A | 0.963631 | |
| B | unknown | ||
| C | 0.117919 |
df2 = df1_stack.reset_index()
df2.set_index('first')
.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}
.dataframe tbody tr th {
vertical-align: top;
}
.dataframe thead th {
text-align: right;
}
| second | third | 总和 | |
|---|---|---|---|
| first | |||
| one | bar | A | 2.71452 |
| one | bar | B | -1.31519 |
| one | bar | C | 0.0231296 |
| one | foo | A | 0.66418 |
| one | foo | B | -0.833609 |
| one | foo | C | -0.96451 |
| three | bar | A | -0.116776 |
| three | bar | B | unknown |
| three | bar | C | 0.450891 |
| three | foo | A | unknown |
| three | foo | B | 0.012846 |
| three | foo | C | unknown |
| two | bar | A | unknown |
| two | bar | B | 0.752643 |
| two | bar | C | unknown |
| two | foo | A | 0.963631 |
| two | foo | B | unknown |
| two | foo | C | 0.117919 |
pandas功能使用rename, reindex, set_index 详解的更多相关文章
- ES6,ES2105核心功能一览,js新特性详解
ES6,ES2105核心功能一览,js新特性详解 过去几年 JavaScript 发生了很大的变化.ES6(ECMAScript 6.ES2105)是 JavaScript 语言的新标准,2015 年 ...
- 【python库模块】Python subprocess模块功能与常见用法实例详解
前言 这篇文章主要介绍了Python subprocess模块功能与常见用法,结合实例形式详细分析了subprocess模块功能.常用函数相关使用技巧. 参考 1. Python subprocess ...
- Pandas系列(六)-时间序列详解
内容目录 1. 基础概述 2. 转换时间戳 3. 生成时间戳范围 4. DatetimeIndex 5. DateOffset对象 6. 与时间序列相关的方法 6.1 移动 6.2 频率转换 6.3 ...
- Pandas透视表(pivot_table)详解
介绍 也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table.虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容 ...
- Linux下针对路由功能配置iptables的方法详解
作为公司上网的路由器需要实现的功能有nat地址转换.dhcp.dns缓存.流量控制.应用程序控制,nat地址转换通过iptables可以直 接实现,dhcp服务需要安装dhcpd,dns缓存功能需要使 ...
- 短视频 SDK 功能点技术实现方式详解
第三方短视频解决方案作为快速切入短视频行业的首选方式,选择一款功能齐全.性能优异的短视频解决方案十分重要. 今天我们来谈谈短视频 SDK 6大重要功能点及其技术实现方式. 短视频拍摄 断点续拍 指在拍 ...
- Pandas系列(一)-Series详解
一.初始Series Series 是一个带有 名称 和索引的一维数组,既然是数组,肯定要说到的就是数组中的元素类型,在 Series 中包含的数据类型可以是整数.浮点.字符串.Python对象等. ...
- centos6.5环境自动化运维之puppet实现nginx反向代理功能及puppet安装配置详解
puppet是一种Linux.Unix.windows平台的集中配置管理系统,使用自有的puppet描述语言,可管理配置文件.用户.cron任务.软件包.系统服务等.puppet把这些系统实体称之为资 ...
- Pandas高级教程之:plot画图详解
目录 简介 基础画图 其他图像 bar stacked bar barh Histograms box Area Scatter Hexagonal bin Pie 在画图中处理NaN数据 其他作图工 ...
随机推荐
- Linux学习-实验楼(1)
1.Shell:命令解释器 2.Linux技能树 3.X11:X窗口系统,其本身只是工具包及架构协议,Xorg是x架构规范的一个实现体,是实现了x协议规范的一个提供图形界面的服务器 4.终端本质上是对 ...
- 也谈谈我对Docker的简单理解
Docker能解决什么问题呢?一个工具的出现必然需要解决一些问题,Docker也不例外,简单说说我们常见的2种情况Docker是如何解决的吧.1.程序在我这跑得好好的,在你那怎么就不行呢?!这是一个典 ...
- C#异步Task编程模型实战手册
一.课程介绍 本次分享课程属于<C#高级编程实战技能开发宝典课程系列>中的第一部分,阿笨后续会计划将实际项目中的一些比较实用的关于C#高级编程的技巧分享出来给大家进行学习,不断的收集.整理 ...
- ViewPager Fragment 懒加载 可见 总结 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- mac下安装xampp、及其之上的组件安装
由于mac下开发需要用到php7,这里是用的xampp集成开发版本.但是mac下安装xampp失败,失败信息如下: Error starting "XAMPP" stack: fa ...
- C#反射实现 C# 反射 判断类的延伸类型 使用代码生成工具Database2Sharp快速生成工作流模块控制器和视图代码 C# ADO.NET的SqlDataReader对象,判断是否包含指定字段 页面中添加锚点的几种方式 .net 简单实用Log4net(多个日志配置文件) C# 常用小点
C#反射实现 一.反射概念: 1.概念: 反射,通俗的讲就是我们在只知道一个对象的内部而不了解内部结构的情况下,通过反射这个技术可以使我们明确这个对象的内部实现. 在.NET中,反射是重要的机制, ...
- Effective Java 第三版——81. 优先使用并发实用程序替代wait和notify
Tips 书中的源代码地址:https://github.com/jbloch/effective-java-3e-source-code 注意,书中的有些代码里方法是基于Java 9 API中的,所 ...
- blender split mesh
https://www.youtube.com/watch?v=yFpxQxEWNc4
- Tomcat线程池的深入理解
1.工作机制: Tomcat启动时如果没有请求过来,那么线程数(都是指线程池的)为0: 一旦有请求,Tomcat会初始化minSpareThreads设置的线程数: 2.线程池作用: Tomcat的线 ...
- wps直接打开CVS文件会把长串数字订单号最后4位变为0
WPS打开CVS文件,发现里面的长串数字订单号后4位全变成0了,而且是以科学计数法来显示了 上网查了下,不能直接打开,得先在WPS(OFFICE中也一样)中新建一个空白表格,然后用菜单里的数据导入功能 ...