区别 |python-pandas库set_index、reset

1、set_index()

作用：DataFrame可以通过set_index方法，将普通列设置为单索引/复合索引。
格式：DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
参数含义：
- keys：列标签或列标签/数组列表，需要设置为索引的普通列
- drop：是否删除原普通列，默认为True，删除用作新索引的原普通列；
- append：是否变成复合索引，默认为False，即覆盖原索引，单索引；
- inplace：默认为False，适当修改DataFrame(不要创建新对象)；
- verify_integrity：默认为false，检查新索引的副本。否则，请将检查推迟到必要时进行。将其设置为false将提高该方法的性能。

案例1：drop的使用

# drop的使用：

import pandas as pd

df = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

print ('输出结果:\n',df)

print('------')

df_drop_t = df.set_index('A',drop=True) # drop默认True，普通列被用作索引后，原列删除

print (df_drop_t)

print('------')

df_drop_f = df.set_index('A',drop=False) # 普通列被用作索引后，原列保留

print (df_drop_f)

'''

输出结果:

     A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

------

     B   C   D

A

A0  B0  C0  D0

A1  B1  C1  D1

A2  B2  C2  D2

A3  B3  C3  D3

A4  B4  C4  D4

------

     A   B   C   D

A

A0  A0  B0  C0  D0

A1  A1  B1  C1  D1

A2  A2  B2  C2  D2

A3  A3  B3  C3  D3

A4  A4  B4  C4  D4

'''

案例2：append的使用

# append的使用

import pandas as pd

df = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

print ('输出结果:\n',df)

print('------')

df_append_f = df.set_index('A', append=False) # append默认为False，普通列变为索引，并覆盖原索引，原索引被删除

print (df_append_f)

df_append_t = df.set_index('A', append=True) #  表示将普通列变为索引，原索引保留，变成了复合索引

print (df_append_t)

print('------')

'''

输出结果:

     A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

------

     B   C   D

A

A0  B0  C0  D0

A1  B1  C1  D1

A2  B2  C2  D2

A3  B3  C3  D3

A4  B4  C4  D4

------

       B   C   D

  A

0 A0  B0  C0  D0

1 A1  B1  C1  D1

2 A2  B2  C2  D2

3 A3  B3  C3  D3

4 A4  B4  C4  D4

'''

案例3：Inplace的使用

# inplace的使用，这里我也没搞懂为啥输出None

df = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

df_inplace_f = df.set_index('A', inplace=False) # inpla默认为False，表示适当修改DataFrame(不要创建新对象)

print ('输出结果：\n',df_inplace_f)

print('------')

df1 = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

df_inplace_t = df1.set_index('A',inplace=True) # 表示原地不动

print (df_inplace_t)

print (type(df_inplace_t))

'''

输出结果：

      B   C   D

A

A0  B0  C0  D0

A1  B1  C1  D1

A2  B2  C2  D2

A3  B3  C3  D3

A4  B4  C4  D4

------

None

<class 'NoneType'>

'''

2、reset_index()

作用：reset_index可以还原索引为普通列，重新变为默认的整型索引
- （注：reset_index还原分为两种类型，第一种是对原DataFrame进行reset，第二种是对使用过set_index()函数的DataFrame进行reset）
格式：DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”)
参数含义：
- level：int、str、tuple或list，默认无，仅从索引中删除给定级别。默认情况下移除所有级别。控制了具体要还原的那个等级的索引
- drop：索引被还原成普通列后，是否删掉列。默认为False，为False时则索引列会被还原为普通列，否则被还原后的的列又会被瞬间删掉；
- inplace：默认为false，适当修改DataFrame(不要创建新对象)；
- col_level：int或str，默认值为0，如果列有多个级别，则确定将标签插入到哪个级别。默认情况下，它将插入到第一级；
- col_fill：对象，默认‘’，如果列有多个级别，则确定其他级别的命名方式。如果没有，则重复索引名；
情况（1）：对原DataFrame进行reset

# 一般情况下参数只使用到drop，这里只演示drop的使用

import pandas as pd

df = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

print ('输出结果\ndf:\n',df)

print('------')

df1 = df.reset_index(drop=False) # 默认为False，原有的索引不变,添加一列，列名index；

print (df1)

print('------')

df2 = df.reset_index(drop=True) # 索引被还原为普通列，瞬间又被删掉了，同时在原位置重置原始索引012...；

print (df2)

'''

输出结果

df:

     A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

------

   index   A   B   C   D

0      0  A0  B0  C0  D0

1      1  A1  B1  C1  D1

2      2  A2  B2  C2  D2

3      3  A3  B3  C3  D3

4      4  A4  B4  C4  D4

------

    A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

'''

情况（2）对使用过set_index()函数的DataFrame进行reset

# 一般情况下参数只使用到drop，这里只演示drop的使用

import pandas as pd

df = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3','A4'],

                     'B': ['B0', 'B1', 'B2', 'B3','B4'],

                     'C': ['C0', 'C1', 'C2', 'C3','C4'],

                     'D': ['D0', 'D1', 'D2', 'D3','D4']})

print ('输出结果：\ndf:\n' ,df)

print('------')

newdf = df.set_index('A') # 这里的drop必需为True（默认为这里的drop必需为True），否则会报错ValueError: cannot insert A, already exists（意思是...只可意会不可言传哈哈）

print (newdf)

print('------')

newdf1 = newdf.reset_index(drop=False) #索引列会被还原为普通列

print (newdf1)

print('------')

newdf2 = newdf.reset_index(drop=True) #索引被还原为普通列，瞬间又被删掉了，同时在原位置重置原始索引；

print (newdf2)

'''

输出结果：

df:

     A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

------

     B   C   D

A

A0  B0  C0  D0

A1  B1  C1  D1

A2  B2  C2  D2

A3  B3  C3  D3

A4  B4  C4  D4

------

    A   B   C   D

0  A0  B0  C0  D0

1  A1  B1  C1  D1

2  A2  B2  C2  D2

3  A3  B3  C3  D3

4  A4  B4  C4  D4

------

    B   C   D

0  B0  C0  D0

1  B1  C1  D1

2  B2  C2  D2

3  B3  C3  D3

4  B4  C4  D4

'''

区别 |python-pandas库set_index、reset_index用法区别的更多相关文章

python pandas 中 loc & iloc 用法区别
转自:https://blog.csdn.net/qq_21840201/article/details/80725433 ### 随机生DataFrame 类型数据import pandas as ...
Python Pandas库的学习（三）
今天我们来继续讲解Python中的Pandas库的基本用法那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...
python pandas库——pivot使用心得
python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...
python numpy库np.percentile用法说明
在python中计算一个多维数组的任意百分比分位数,此处的百分位是从小到大排列,只需用np.percentile即可…… a = range(1,101) #求取a数列第90%分位的数值 np.per ...
Python pandas库159个常用方法使用说明
Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...
Python模板库Mako的用法
官网地址:http://www.makotemplates.org/ 文档地址:http://docs.makotemplates.org/ 中文文档基本用法地址:http://www.open-op ...
Python Pandas库的学习（一）
今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...
Python——Pandas库入门
一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...
Python Pandas库初步使用
用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值

随机推荐

Web.xml配置详解之context-param（转）
转自:http://blog.csdn.net/liaoxiaohua1981/article/details/6759206 格式定义: <context-param> <para ...
如何基于 Nacos 和 Sentinel ，实现灰度路由和流量防护一体化
基于Alibaba Nacos和Sentinel,实现灰度路由和流量防护一体化的解决方案,发布在最新的 Nepxion Discovery 5.4.0 版,具体参考: 源码主页,请访问源码主页指南主 ...
Read Committed
在Read Committed隔离级别下,一个事务可能会遇到不可重复读(Non Repeatable Read)的问题. 不可重复读是指,在一个事务内,多次读同一数据,在这个事务还没有结束时,如果另一 ...
树形dp+贪心+增量法+排序——cf1241E(好题)
/* 给定一棵树,每个结点最多选和其相连的k条边,问使边权和最大的策略 dp[u][0|1]用来表示u没连父边|连了父边时u子树下的最优解如果u不和任意一个儿子连边,那么u下的收益是tot=sum ...
RichView
TRichView中文文档 TRichView 是Delphi/C++Builder 控件,主要用于显示.编辑和打印超文本文档. 新版本解决多个兼容性问题,更新了字符串标签.剪贴板.RTF和DB组件 ...
Ext——xtype各组件类型
Ext.form.TextField的 xtype类型
idea 中使用dataBase插件
最近一段时间重新开始学习Java 使用IntelliJ 发现有个链接数据库插件挺好用的,并且反应速度还挺快的记录下. 点击步骤:View → Tool Windows → data 进行数据库链接发 ...
nodejs 内存泄漏
This looks OK at first glance. We could think that theThing get's overwritten with every invocation ...
UVA - 10347 - Medians（由三中线求三角形面积）
AC代码: #include<cstdio> #include<cmath> #include<algorithm> #include<iostream> ...
剑指offer——64和为s的数字
题目描述输入一个递增排序的数组和一个数字S,在数组中查找两个数,使得他们的和正好是S,如果有多对数字的和等于S,输出两个数的乘积最小的. 输出描述: 对应每个测试案例,输出两个数,小的先输出. 题解 ...

区别 |python-pandas库set_index、reset_index用法区别

区别 |python-pandas库set_index、reset_index用法区别的更多相关文章

随机推荐

热门专题