一、调整索引、修改列标签

1、调整索引的两种情况：

重新索引
设置新的索引

（1）重新索引

　　在Pandas对象中，其实索引也是一个对象，所以可对其进行修改。

　　　　例如：df.index=['a','b','c']

>>> df = {'one':pd.Series(np.random.randn(3)),'two':pd.Series(np.random.randn(3)),

'three':pd.Series(np.random.rand(3))}

>>> df = pd.DataFrame(df)

>>> df

        one       two     three

0 -0.996986  0.190981  0.482912

1 -0.233812 -0.140953  0.052706

2  0.470900  0.590664  0.486823

#设置索引

>>> df.index=['a','b','c']

>>> df

        one       two     three

a -0.996986  0.190981  0.482912

b -0.233812 -0.140953  0.052706

c  0.470900  0.590664  0.486823

（2）设置新的索引

　　reindex()：重新索引并得到一个新的Pandas对象。

　　且reindex()方法不仅可以重新索引DataFrame，也可以同时实现过滤功能。

>>> new = df.reindex(['b','c','e'])

>>> new

        one       two     three

b -0.233812 -0.140953  0.052706

c  0.470900  0.590664  0.486823

e       NaN       NaN       NaN

　　reindex()也可以用来调整列的顺序，这时需要设定axis参数为'columns'或1；

>>> df.reindex(['three','two','one'],axis='columns')

      three       two       one

a  0.766450  0.452801  1.286715

b  0.342262  1.523188  0.620788

c  0.867786  0.758714 -2.343242

（3）使用set_index()可以指定某一列为索引，这在对日期型数据或者是以名称进行区分的数据非常有用，后期会以实例描述的更为详细。

>>> df.set_index('one')

                two     three

one

-0.996986  0.190981  0.482912

-0.233812 -0.140953  0.052706

 0.470900  0.590664  0.486823

　　上述的方法在将某一列设置为索引后，特征不会将该列进行保存，若需要将设置为索引的列保留在数据中，则需要将参数drop设置为False：

　　>>> df.set_index('one',drop=False)

                one       two     three

one

 1.286715  1.286715  0.452801  0.766450

 0.620788  0.620788  1.523188  0.342262

-2.343242 -2.343242  0.758714  0.867786

　　若是希望在原来索引的基础之上添加新的变量构成层次化索引，则设置append参数为True；　　

　　>>>df.set_index('one',append=True)

>>> df

        one       two     three

a  1.286715  0.452801  0.766450

b  0.620788  1.523188  0.342262

c -2.343242  0.758714  0.867786

>>> df.set_index('one',append=True)

                  two     three

  one

a  1.286715  0.452801  0.766450

b  0.620788  1.523188  0.342262

c -2.343242  0.758714  0.867786

>>>

2、修改标签

　　修改索引和列名的标签可以使用rename()方法结合字典、Series或者一个原函数将标签映射为一个新的标签。

　　（1）关于结合字典可以参照3-Pandas之Series和DataFrame区别的第六部分，

　　（2）使用函数映射的方式

　　例：将字符串的大写转换函数传入，对列标签进行修改

>>> df.rename(columns=str.upper)

        ONE       TWO     THREE

a -0.996986  0.190981  0.482912

b -0.233812 -0.140953  0.052706

c  0.470900  0.590664  0.486823

　　例：结合lambda：将所有的列的前2个字符大写，其余小写

>>> df.rename(columns=lambda x:x[:2].upper()+x[2:].lower())

        ONe       TWo     THree

a -0.996986  0.190981  0.482912

b -0.233812 -0.140953  0.052706

c  0.470900  0.590664  0.486823

二、创建层次化索引

　　层次化索引可以基于Series和DataFrame创建更加高维的数据。

　　也就是说，若有一个DataFrame是一个堆积式的（在一个轴上需要创建不止一个索引），那么此时就需要用到层次化索引，这和Panel有些类似。但是在实际中并不是很常用！

创建一个层次化索引：

>>> data=pd.Series(np.random.randn(5),index=[['a','a','b','b','b'],['a1','a2','b1','b2','b3']])

>>> data

a  a1    0.792324

   a2   -0.650764

b  b1   -0.282874

   b2   -1.402477

   b3   -3.551578

dtype: float64

#查看索引

>>> data.index

MultiIndex(levels=[['a', 'b'], ['a1', 'a2', 'b1', 'b2', 'b3']],

           codes=[[0, 0, 1, 1, 1], [0, 1, 2, 3, 4]])

#levels包含了每个级别索引的标签，labels是对每个数据在对应不同levels的位置进行了标记

每个index均有一个属性（名称names），可通过.index.names对索引列的列名进行创建于修改

>>> data.index.names=['first','second']

>>> data

first  second

a      a1        0.792324

       a2       -0.650764

b      b1       -0.282874

       b2       -1.402477

       b3       -3.551578

dtype: float64

三、重排级别顺序

重排级别顺序是基于有索引个数>=1的DataFrame。

（1）swaplevel():将columns轴上的索引级别进行互换。

　　>>>df.swaplevel(0,1,axis=1)

（2）reorder_levels()：指定多个级别的顺序

（3）提取数据还是可以使用iloc()与loc()

（4）unstack()：若index轴上有多个级别索引的DataFrame，使用该方法将指定级别(level参数)安排在columns上形成一个新的DataFrame

7-Pandas之索引调整方法的更多相关文章

pandas重置索引的几种方法探究
pandas重置索引的几种方法探究 reset_index() reindex() set_index() 函数名字看起来非常有趣吧! 不仅如此. 需要探究. http://nbviewer.jupy ...
Pandas 常见的基本方法
说明:文章所有内容均截选自实验楼教程[Pandas 使用教程],想要查看教程完整内容,点击教程即可~ 前言: Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取.转换.过滤 ...
pandas DataFrame的修改方法
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas DataFrame的查询方法（loc,iloc,at,iat,ix的用法和区别）
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas DataFrame的创建方法
pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...
pandas.DataFrame的groupby()方法的基本使用
pandas.DataFrame的groupby()方法是一个特别常用和有用的方法.让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝. 首先导入package: import p ...
Pandas | 13 索引和选择数据
Pandas现在支持三种类型的多轴索引; 编号索引描述 1 .loc() 基于标签 2 .iloc() 基于整数 3 .ix() 基于标签和整数 .loc() Pandas提供了各种方法来完成基于 ...
SQL索引优化方法
SQL索引优化方法以下是代码片段: ROW_NUMBER() OVER(ORDER BY ResumeCreateTime DESC) as [RowID] ,[TopDegree] ,[Degre ...
(三）pandas 层次化索引
pandas层次化索引 1. 创建多层行索引 1) 隐式构造最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组 Series也可以创建多层索引 import numpy ...

随机推荐

.gitkeep文件
git 默认不会对空文件夹进行追踪: 但某些项目某些文件夹对整体框架是必不可少的,就算是空也得有: 怎么办呢?在这个文件夹下添加一个[.gitkeep]文件,这样就可以同步该文件夹了. (完)
PHPstorm快捷键的学习
1.Ctrl + 空格当输入代码时,PHPstorm 会自动出现联想选项. 但是,如果在输入时联想时错过了选择,我们要想让他再一次出现联想,通常采用的方法是在先前的输入后面再输入字符,这时联想又会出 ...
JVM类加载机制小结
这篇文章我们关注一个问题:Java程序是怎么进入JVM并执行的?经常写Java程序的小伙伴应该都听说过类加载机制,在<深入理解Java虚拟机>里周老师已经讲的很清楚了,这篇随笔把之前的笔记 ...
MySQL的数据类型及注意事项
MySQL的数据类型注意选择合适的数据类型,能节省储存空间,提升计算性能.(1)在符合应用要求(取值范围.精度)的前提下,尽量使用“短”数据类型(2)数据类型越简单越好.(3)在MySQL中, ...
介绍web开发中实现会话跟踪的常用技术方法
由于http是无状态的协议,这种特性严重阻碍了客户端与服务器进行动态交互,例如购物车程序,客户在购物车中添加了商品,服务器如何知道购物车已有的物品呢?为了支持客户端与服务器之间的交互,为了弥补http ...
web页面弹出遮罩层,通过js或css禁止蒙层底部页面跟随滚动
场景概述弹窗是一种常见的交互方式,而蒙层是弹窗必不可少的元素,用于隔断页面与弹窗区块,暂时阻断页面的交互.但是,在蒙层元素中滑动的时候,滑到内容的尽头时,再继续滑动,蒙层底部的页面会开始滚动,显然这 ...
JavaScript图形实例：随机SierPinski三角形
在“JavaScript图形实例:SierPinski三角形”中,我们介绍了SierPinski三角形的基本绘制方法,在“JavaScript图形实例:迭代函数系统生成图形”一文中,介绍了采用IFS方 ...
day08总结
集合常用操作# 一.关系运算firends1 = {"zero", "kevin", "jason", "egon"}f ...
day36 作业
客户端 import struct import json from socket import * client=socket(AF_INET,SOCK_STREAM) # client.conne ...
vue组件keepAlive的使用
需要达到的效果: 列表页------->详情页/修改------>返回列表页(缓存列表页) 其它不缓存 //vuex/index.js new Vuex.store({ state: { ...

7-Pandas之索引调整方法