Pandas的索引操作

索引对象Index

1. Series和DataFrame中的索引都是Index对象

示例代码：

print(type(ser_obj.index))

print(type(df_obj2.index))

print(df_obj2.index)

运行结果：

<class 'pandas.indexes.range.RangeIndex'>

<class 'pandas.indexes.numeric.Int64Index'>

Int64Index([0, 1, 2, 3], dtype='int64')

2. 索引对象不可变，保证了数据的安全

示例代码：

# 索引对象不可变

df_obj2.index[0] = 2

运行结果：

---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

<ipython-input-23-7f40a356d7d1> in <module>()

      1 # 索引对象不可变

----> 2 df_obj2.index[0] = 2

/Users/Power/anaconda/lib/python3.6/site-packages/pandas/indexes/base.py in __setitem__(self, key, value)

   1402

   1403     def __setitem__(self, key, value):

-> 1404         raise TypeError("Index does not support mutable operations")

   1405

   1406     def __getitem__(self, key):

TypeError: Index does not support mutable operations

常见的Index种类

Index，索引
Int64Index，整数索引
MultiIndex，层级索引
DatetimeIndex，时间戳类型

Series索引

1. index 指定行索引名

示例代码：

ser_obj = pd.Series(range(5), index = ['a', 'b', 'c', 'd', 'e'])

print(ser_obj.head())

运行结果：

a    0

b    1

c    2

d    3

e    4

dtype: int64

2. 行索引

ser_obj[‘label’], ser_obj[pos]

示例代码：

# 行索引

print(ser_obj['b'])

print(ser_obj[2])

运行结果：

1

2

3. 切片索引

ser_obj[2:4], ser_obj[‘label1’: ’label3’]

注意，按索引名切片操作时，是包含终止索引的。

示例代码：

# 切片索引

print(ser_obj[1:3])

print(ser_obj['b':'d'])

运行结果：

b    1

c    2

dtype: int64

b    1

c    2

d    3

dtype: int64

4. 不连续索引

ser_obj[[‘label1’, ’label2’, ‘label3’]]

示例代码：

# 不连续索引

print(ser_obj[[0, 2, 4]])

print(ser_obj[['a', 'e']])

运行结果：

a    0

c    2

e    4

dtype: int64

a    0

e    4

dtype: int64

5. 布尔索引

示例代码：

# 布尔索引

ser_bool = ser_obj > 2

print(ser_bool)

print(ser_obj[ser_bool])

print(ser_obj[ser_obj > 2])

运行结果：

a    False

b    False

c    False

d     True

e     True

dtype: bool

d    3

e    4

dtype: int64

d    3

e    4

dtype: int64

DataFrame索引

1. columns 指定列索引名

示例代码：

import numpy as np

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])

print(df_obj.head())

运行结果：

          a         b         c         d

0 -0.241678  0.621589  0.843546 -0.383105

1 -0.526918 -0.485325  1.124420 -0.653144

2 -1.074163  0.939324 -0.309822 -0.209149

3 -0.716816  1.844654 -2.123637 -1.323484

4  0.368212 -0.910324  0.064703  0.486016

2. 列索引

df_obj[[‘label’]]

示例代码：

# 列索引

print(df_obj['a']) # 返回Series类型

print(df_obj[[0]]) # 返回DataFrame类型

print(type(df_obj[[0]])) # 返回DataFrame类型

运行结果：

0   -0.241678

1   -0.526918

2   -1.074163

3   -0.716816

4    0.368212

Name: a, dtype: float64

<class 'pandas.core.frame.DataFrame'>

3. 不连续索引

df_obj[[‘label1’, ‘label2’]]

示例代码：

# 不连续索引

print(df_obj[['a','c']])

print(df_obj[[1, 3]])

运行结果：

          a         c

0 -0.241678  0.843546

1 -0.526918  1.124420

2 -1.074163 -0.309822

3 -0.716816 -2.123637

4  0.368212  0.064703

          b         d

0  0.621589 -0.383105

1 -0.485325 -0.653144

2  0.939324 -0.209149

3  1.844654 -1.323484

4 -0.910324  0.486016

高级索引：标签、位置和混合

Pandas的高级索引有3种

1. loc 标签索引

DataFrame 不能直接切片，可以通过loc来做切片

loc是基于标签名的索引，也就是我们自定义的索引名

示例代码：

# 标签索引 loc

# Series

print(ser_obj['b':'d'])

print(ser_obj.loc['b':'d'])

# DataFrame

print(df_obj['a'])

# 第一个参数索引行，第二个参数是列

print(df_obj.loc[0:2, 'a'])

运行结果：

b    1

c    2

d    3

dtype: int64

b    1

c    2

d    3

dtype: int64

0   -0.241678

1   -0.526918

2   -1.074163

3   -0.716816

4    0.368212

Name: a, dtype: float64

0   -0.241678

1   -0.526918

2   -1.074163

Name: a, dtype: float64

2. iloc 位置索引

作用和loc一样，不过是基于索引编号来索引

示例代码：

# 整型位置索引 iloc

# Series

print(ser_obj[1:3])

print(ser_obj.iloc[1:3])

# DataFrame

print(df_obj.iloc[0:2, 0]) # 注意和df_obj.loc[0:2, 'a']的区别

运行结果：

b    1

c    2

dtype: int64

b    1

c    2

dtype: int64

0   -0.241678

1   -0.526918

Name: a, dtype: float64

3. ix 标签与位置混合索引

ix是以上二者的综合，既可以使用索引编号，又可以使用自定义索引，要视情况不同来使用，

如果索引既有数字又有英文，那么这种方式是不建议使用的，容易导致定位的混乱。

示例代码：

# 混合索引 ix

# Series

print(ser_obj.ix[1:3])

print(ser_obj.ix['b':'c'])

# DataFrame

print(df_obj.loc[0:2, 'a'])

print(df_obj.ix[0:2, 0])

运行结果：

b    1

c    2

dtype: int64

b    1

c    2

dtype: int64

0   -0.241678

1   -0.526918

2   -1.074163

Name: a, dtype: float64

注意

DataFrame索引操作，可将其看作ndarray的索引操作

标签的切片索引是包含末尾位置的

pandas索引操作的更多相关文章

【python】pandas 索引操作
选择.修改数据(单层索引) 推荐使用.at..iat..loc..iloc 操作句法结果备注选择列 df[col] Series 基于列名(列的标签),返回Series 用标签选择行 df.l ...
数据分析06 /pandas高级操作相关案例：人口案例分析、2012美国大选献金项目数据分析
数据分析06 /pandas高级操作相关案例:人口案例分析.2012美国大选献金项目数据分析目录数据分析06 /pandas高级操作相关案例:人口案例分析.2012美国大选献金项目数据分析 1. ...
pandas神器操作excel表格大全（数据分析数据预处理）
使用pandas库操作excel,csv表格操作大全关注公众号"轻松学编程"了解更多,文末有公众号二维码,可以扫码关注哦. 前言准备三份csv表格做演示: 成绩表.csv su ...
pandas高级操作
pandas高级操作 import numpy as np import pandas as pd from pandas import DataFrame,Series 替换操作替换操作可以同步作 ...
【Python自动化Excel】Python与pandas字符串操作
Python之所以能够成为流行的数据分析语言,有一部分原因在于其简洁易用的字符串处理能力. Python的字符串对象封装了很多开箱即用的内置方法,处理单个字符串时十分方便:对于Excel.csv等表格 ...
Mongodb学习笔记三(Mongodb索引操作及性能测试)
第三章索引操作及性能测试索引在大数据下的重要性就不多说了下面测试中用到了mongodb的一个客户端工具Robomongo,大家可以在网上选择下载.官网下载地址:http://www.robomo ...
Elasticsearch-PHP 索引操作(转)
索引操作本节通过客户端来介绍一下索引API的各种操作.索引操作包含任何管理索引本身(例如,创建索引,删除索引,更改映射等等). 我们通过一些常见的操作的代码片段来介绍,然后在表格中列出剩下的方法.R ...
ElasticSearch+Kibana 索引操作
ElasticSearch+Kibana 索引操作一前言 ElasticiSearch 简介 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引 ...
Mysql之表的操作与索引操作
表的操作: 1.表的创建: create table if not exists table_name(字段定义); 例子: create table if not exists user(id in ...

随机推荐

JSON.parse()和JSON.stringify()以及stringify()字符串格式化
1. parse用于从一个字符串中解析出json对象,如var str = '{"name":"huangxiaojian","age":& ...
Workflow Builder 2.6.3 Certified on Windows 10 for EBS 12.x
By Steven Chan - EBS-Oracle on May 17, 2016 Workflow Builder 2.6.3 is now certified on Windows 10 de ...
hdu4715
题解: 二分图判断建立原图的补图判断是否是二分图代码: #include<cstdio> #include<cmath> #include<cstring> ...
【SQL查询】按照多个字段进行排序_order by
注: 1. 当前面的排序存在重复的项,后面的排序才会起作用. [示例1]:前面的排序不存在重复的项 [示例2]:前面的排序存在重复的项
C++友元类实现
C++中的友元既可以实现友元函数,也可以实现友元类,也就是说一个类也可以作为另外一个类的友元.当作为一个类的友元时,它的所有成员函数都是另一个类的友元函数,都可以访问另一个类的私有或者公有成员. 请看 ...
windows获取屏幕显示比例读取注册表法
static int GetDesktopScale() { ; HINSTANCE hUser32 = LoadLibrary(L"user32.dll"); if (hUser ...
进程（并发，并行） join start 进程池（同步异步）
一.背景知识顾名思义,进程即正在执行的一个过程.进程是对正在运行程序的一个抽象.进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一.操作系统的其他所有 ...
Python开发简单记事本
摘要: 本文是使用Python,结合Tkinter开发简单记事本. 本文的操作环境:ubuntu,Python2.7,采用的是Pycharm进行代码编辑,个人很喜欢它的代码自动补齐功能. 最近很想对p ...
Jolt Awards: The Best Books
Jolt大奖素有“软件业界的奥斯卡”之美誉,共设通用类图书.技术类图书.语言和开发环境.框架库和组件.开发者网站等十余个分类,每个分类设有一个“震撼奖”(Jolt Award)和三个“生产力奖”(Pr ...
SGU 507 Treediff
这个题目其实可以暴力用两个 set 合并: 每次放进去一个元素只要找到这个元素第一个比他大的元素和最后一个比他小的元素:然后更新最优值: 证明为什么不会超时: 假如最后集合的小的为 S1,大 ...

pandas索引操作

Pandas的索引操作

索引对象Index

1. Series和DataFrame中的索引都是Index对象

2. 索引对象不可变，保证了数据的安全

常见的Index种类

Series索引

1. index 指定行索引名

2. 行索引

3. 切片索引

4. 不连续索引

5. 布尔索引

DataFrame索引

1. columns 指定列索引名

2. 列索引

3. 不连续索引

高级索引：标签、位置和混合

1. loc 标签索引

2. iloc 位置索引

3. ix 标签与位置混合索引

注意

pandas索引操作的更多相关文章

随机推荐

热门专题