Pandas基本功能之选取索引和过滤

索引、选取和过滤

大部分的查询用法

类型	说明
obj[val]	选取DataFrame的单个列或一组列
obj.ix[val]	选取DataFrame的单个行或一组行
obj.ix[:,val]	选取单个列或列子集
obj.ix[val1,val2]	同时选取行和列
reindex方法	将一个或多个轴匹配到新索引
xs方法	根据标签选取单行或单列，并返回一个Series
icol、irow方法	根据整数位置选取单列或单行，并返回Series
get_value、set_value方法	根据行标签和列标签选取单个值

示例

Series

obj = Series(np.arange(4.),index=['a','b','c','d'])

obj

a    0.0

b    1.0

c    2.0

d    3.0

dtype: float64

Series索引查

obj[1]

1.0

obj[1:3]

b    1.0

c    2.0

dtype: float64

Series索引的标签查询，它和切片的区别，不只顾头还顾尾

obj['a':'c']

a    0.0

b    1.0

c    2.0

dtype: float64

obj['a':'c']=5

obj

a    5.0

b    5.0

c    5.0

d    3.0

dtype: float64

DataFrame

操作列进行查询的方式

data = pd.DataFrame(np.arange(16).reshape(4,4),index=['a','b','c','d'],columns=['one','two','three','four'])

data

one	two	three	four

a	0	1	2	3

b	4	5	6	7

c	8	9	10	11

d	12	13	14	15

直接操作索引会报错,用索引查必须是切片，选取行

data[0:2]

one	two	three	four

a	0	0	0	0

b	0	5	6	7

可以用列索引的标签名字查询

data[['one','two','three']]

one	two	three

a	0	1	2

b	4	5	6

c	8	9	10

d	12	13	14

ix操作行进行查询，ix[行,列]

data.ix[['a','b'],['two','four']]

two	four

a	1	3

b	5	7

ix查询不只顾头也顾尾

data.ix[:'c',:'two']

one	two

a	0	1

b	4	5

c	8	9

利用布尔值进行查询

# 行大于7，的前两列，这里边的切片查询依然是顾头不顾尾

data.ix[data.three>7,:2]

one	two

c	8	9

d	12	13

个人总结查询使用Series操作索引是直接行操作，如果使用DataFrame进行索引默认都是操作列，操作行需要使用ix

Pandas基本功能之选取索引和过滤的更多相关文章

Pandas基本功能之层次化索引及层次化汇总
层次化索引层次化也就是在一个轴上拥有多个索引级别 Series的层次化索引 data=Series(np.random.randn(10),index=[ ['a','a','a','b','b', ...
pandas小记：pandas高级功能
http://blog.csdn.net/pipisorry/article/details/53486777 pandas高级功能:面板数据.字符串方法.分类.可视化. 面板数据 {pandas数据 ...
pandas读书笔记、重新索引
重新索引 pandas对象的一个重要方法是 reindex ,其作用是创建一个适应新索引的新对象. #reindex函数的参数 reindex(index,method,fill_value, ...
数据可视化基础专题（六）：Pandas基础（五）索引和数据选择器（查找）
1.序言如何切片,切块,以及通常获取和设置pandas对象的子集 2.索引的不同选择对象选择已经有许多用户请求的添加,以支持更明确的基于位置的索引.Pandas现在支持三种类型的多轴索引. .lo ...
Pandas基本功能详解
Pandas基本功能详解 Pandas Pandas基本功能详解 |轻松玩转Pandas(2) 参考:Pandas基本功能详解 |轻松玩转Pandas(2)
Pandas基本功能之reindex重新索引
重新索引 reindex重置索引,如果索引值不存在,就引入缺失值参数介绍参数说明 index 用作索引的新序列 method 插值 fill_vlaue 引入缺失值时的替代NaN limit 最 ...
pandas数组和numpy数组在使用索引数组过滤数组时的区别
numpy array 过滤后的数组,索引值从 0 开始. pandas Series 过滤后的 Series ,保持原来的索引,原来索引是几,就是几. 什么意思呢,来看个栗子: import num ...
Pandas常用功能总结
1.读取.csv文件 df2 = pd.read_csv('beijingsale.csv', encoding='gb2312',index_col='id',sep='\t',header=Non ...
pandas：由列层次化索引延伸的一些思考
1. 删除列层次化索引用pandas利用df.groupby.agg() 做聚合运算时遇到一个问题:产生了列方向上的两级索引,且需要删除一级索引.具体代码如下: # 每个uesr每天消费金额统计:和 ...

随机推荐

修改json文件
第三方库jq https://stedolan.github.io/jq/manual/ cat old_deploy.json \ | jq --arg cpu_limit $cpu_limit ' ...
代码：jquery自定义插件 demo
jquery自定义插件 demo 2016-1-13 只是一个简易的示例 <script type="text/javascript" src="http://cd ...
Android自定义View学习（三）
属性动画(上) 参考:HenCoder 自定义绘制的第 1-6 期:属性动画 Property Animation(上手篇) Interpolator 其实就是速度设置器,设置动画运行的速度. 属性动 ...
利用STM32CubeMX来生成USB_HID_Mouse工程【添加ADC】（1）
现在原来的基础上添加ADC的功能. 现在(利用STM32CubeMX来生成USB_HID_Mouse工程)基础上新增硬件 JoyStick Shield 游戏摇杆扩展板与STM32F103C8的连接 ...
飞鸽传书linux进程退出不彻底
问题描述: 飞鸽传书linux版本(QIpmsg)是有问题的. 在ubuntu14.04上运行的时候,没有任务栏图标,点击关闭也不能退出进程,端口仍然占用,无法再次运行. 这个问题截至1.2.1412 ...
机器学习进阶-人脸关键点检测 1.dlib.get_frontal_face_detector(构建人脸框位置检测器) 2.dlib.shape_predictor(绘制人脸关键点检测器) 3.cv2.convexHull(获得凸包位置信息)
1.dlib.get_frontal_face_detector() # 获得人脸框位置的检测器, detector(gray, 1) gray表示灰度图, 2.dlib.shape_predict ...
day09-数据库插入中文报错
在向数据库表中插入中文时一直报错 MySQL的默认编码是Latin1,不支持中文,要支持中文需要把数据库的默认编码修改为gbk或者utf8. 1.需要以root用户身份登陆才可以查看数据库编码方式(以 ...
day36-常见内置模块五(collections、xml模块)
一.collections模块在内置数据类型(dict.list.set.tuple)的基础上,collections模块还提供了几个额外的数据类型:namedtuple.deque.Counter ...
jquery 基础-记住
jquery最为一个库,简便. 难点在于选择器,筛选器的使用. 属性一般都是,jquery对象.函数(),括号内部添属性. s= '<tr> <td class="fix& ...
python-玉米（小米）商城作业
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

Pandas基本功能之选取索引和过滤

索引、选取和过滤

大部分的查询用法

示例

Series索引查

Series索引的标签查询，它和切片的区别，不只顾头还顾尾

操作列进行查询的方式

直接操作索引会报错,用索引查必须是切片，选取行

可以用列索引的标签名字查询

ix操作行进行查询，ix[行,列]

ix查询不只顾头也顾尾

利用布尔值进行查询

Pandas基本功能之选取索引和过滤的更多相关文章

随机推荐

热门专题