pandas 索引、选取和过滤

Series索引的工作方式类似于NumPy数组的索引，不过Series的索引值不只是整数，如：

import numpy as np

import pandas as pd

from pandas import Series,DataFrame

obj=Series(np.arange(4),index=['a','b','c','d'])

obj=Series(np.arange(4),index=['a','b','c','d'])

obj

Out[10]:

a    0

b    1

c    2

d    3

dtype: int32

obj['b']

Out[11]: 1

obj[1]

Out[12]: 1

obj[2:4]

Out[13]:

c    2

d    3

dtype: int32

obj[['b','a','d']]

Out[14]:

b    1

a    0

d    3

dtype: int32

obj[[1,3]]

Out[15]:

b    1

d    3

dtype: int32

obj[obj<2]
Out[17]:
a 0
b 1
dtype: int32

#利用标签索引与普通的Python切片运算不同

#因为末端是包含的

obj['b':'c']=5

obj

Out[24]:

a    0

b    5

c    5

d    3

dtype: int32

DataFrame 进行索引其实就是获取一个或者多个列：

获取列：指定列名称即可

data=DataFrame(np.arange(16).reshape((4,4)),index=['Ohio','Colorado','Utah','New York'],columns=['one','two','three','four'])

data

Out[26]:

          one  two  three  four

Ohio        0    1      2     3

Colorado    4    5      6     7

Utah        8    9     10    11

New York   12   13     14    15

data['two']

Out[27]:

Ohio         1

Colorado     5

Utah         9

New York    13

Name: two, dtype: int32

data[['three','one']]

Out[28]:

          three  one

Ohio          2    0

Colorado      6    4

Utah         10    8

New York     14   12

获取行：

（1）通过切片或布尔型数组；

（2）通过布尔型DataFrame进行索引；

（3）在行上标签索引，引入索引字段ix，它可以通过NumPy式的标记法及轴标签从DataFrame中选取行和列的子集。

#切片获取行

data[:2]

Out[29]:

          one  two  three  four

Ohio        0    1      2     3

Colorado    4    5      6     7

#布尔型数组获取行

data[data['three']>5]

Out[30]:

          one  two  three  four

Colorado    4    5      6     7

Utah        8    9     10    11

New York   12   13     14    15

#布尔型DataFrame进行索引

data<5

Out[31]:

            one    two  three   four

Ohio       True   True   True   True

Colorado   True  False  False  False

Utah      False  False  False  False

New York  False  False  False  False

#将data<5的数值赋值为0

data[data<5]=0

data

Out[33]:

          one  two  three  four

Ohio        0    0      0     0

Colorado    0    5      6     7

Utah        8    9     10    11

New York   12   13     14    15

#行上进行标签索引，使用索引字段ix

data.ix['Colorado',['two','three']]

Out[34]:

two      5

three    6

Name: Colorado, dtype: int32

data.ix[['Colorado','Utah'],[3,0,1]]

Out[35]:

          four  one  two

Colorado     7    0    5

Utah        11    8    9

#索引的是行索引号为2的数据，也就是行Utah

data.ix[2]

Out[36]:

one       8

two       9

three    10

four     11

Name: Utah, dtype: int32

data.ix[:'Utah','two']

Out[37]:

Ohio        0

Colorado    5

Utah        9

Name: two, dtype: int32

#索引data.three>5的行

data.ix[data.three>5,:3]

Out[38]:

          one  two  three

Colorado    0    5      6

Utah        8    9     10

New York   12   13     14

DataFrame的索引选项

#选取DataFrame的单个列或者一组列

obj[val]

#选取的单个行或者一组行

obj.ix[val]

#选取单个列或列的子集

obj.ix[:,val]

#同时选取行和列

obj.ix[val1,val2]

pandas 索引、选取和过滤的更多相关文章

Pandas DataFrame 数据选取和过滤
This would allow chaining operations like: pd.read_csv('imdb.txt') .sort(columns='year') .filter(lam ...
python数据分析之pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]
1 引言 Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用.本文主要介绍Pandas的几种数据选取的方法. Pandas中,数据主要保存为Dataframe和Se ...
pandas子集选取的三种方法：[]、.loc[]、.iloc[]
pandas读取Excel.csv文件中的数据时,得到的大多是表格型的二维数据,在pandas中对应的即为DataFrame数据结构.在处理这类数据时,往往要根据据需求先获取数据中的子集,如某些列.某 ...
【python】pandas 索引操作
选择.修改数据(单层索引) 推荐使用.at..iat..loc..iloc 操作句法结果备注选择列 df[col] Series 基于列名(列的标签),返回Series 用标签选择行 df.l ...
python pandas.DataFrame选取、修改数据最好用.loc，.iloc，.ix
先手工生出一个数据框吧 import numpy as np import pandas as pd df = pd.DataFrame(np.arange(0,60,2).reshape(10,3) ...
pandas 索引与列相互转化
1. 准备数据 import pandas as pd from io import StringIO csv_txt = '''"date","player1" ...
Pandas索引和选择数据
在本章中,我们将讨论如何切割和丢弃日期,并获取Pandas中大对象的子集. Python和NumPy索引运算符"[]"和属性运算符".". 可以在广泛的用例中快 ...
pandas索引操作
Pandas的索引操作索引对象Index 1. Series和DataFrame中的索引都是Index对象示例代码: print(type(ser_obj.index)) print(type(d ...
Pandas 索引和切片
Series和Datafram索引的原理一样,我们以Dataframe的索引为主来学习列索引:df['列名'] (Series不存在列索引) 行索引:df.loc[].df.iloc[] 选择列 / ...

随机推荐

导出CSV格式
import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype. ...
MySQL-技术专区-mysql数据库权限管理
登入root账户 mysql -u root -p 查看所有用户 select host,user from mysql.user; 查看某个用户的权限: show grants for user ...
PAT程序设计
VS2013中自行对齐的快捷键操作: CTRL+K+F 1.定义二维数组 ]=]; 2.绝对值函数 int abs(int i) 返回整型参数i的绝对值 double cabs(struct comp ...
Maven入门指南11：使用Nexus搭建Maven私服
1 . 私服简介私服是架设在局域网的一种特殊的远程仓库,目的是代理远程仓库及部署第三方构件.有了私服之后,当 Maven 需要下载构件时,直接请求私服,私服上存在则下载到本地仓库:否则,私服请求外部 ...
Python第五节元组
Python第八节元组补充元组从形式上看,和列表唯一不同的在于,列表是中括号,元组是小括号元组内的元素不可更改一. 创建创建直接在小括号内写元素,用逗号隔开就好创建空元祖只写一个小括号元 ...
ssh-keyscan - 收集 ssh 公钥
总览 (SYNOPSIS) ssh-keyscan -words [-v46 ] [-p port ] [-T timeout ] [-t type ] [-f file ] [host | addr ...
Linux 临时和永久关闭 Selinux
查看当前 Selinux 状态:getenforce 临时关闭 Selinux:setenforce 0 永久关闭 Selinux: vim /etc/sysconfig/selinux 将 SELI ...
Scala（一）基础
OOP 面向对象编程 AOP 面向切面编程 FP 函数式编程编程语言都要定义变量,一些代码是用来注释的,变量和变量之间有一些关系,要做一些运算,运算离不开流程控制,进行运算的数据往往来自数据结构,最 ...
Office VBA 参考
Office VBA 参考:https://docs.microsoft.com/zh-CN/office/vba/api/overview/
CSS制作红桃心
这里主要用到了before与after属性之前之后代码: <!DOCTYPE html> <html> <head> <meta charset=" ...

pandas 索引、选取和过滤

pandas 索引、选取和过滤的更多相关文章

随机推荐

热门专题