pandas 2 选择数据

from __future__ import print_function

import pandas as pd

import numpy as np

np.random.seed(1)

dates = pd.date_range('20130101', periods=6)

df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=['A', 'B', 'C', 'D'])

print(df['A'], df.A)                       # 选取属性值为‘A’的列，两种方法效果相同

print(df[0:3], df['20130102':'20130104'])  # 选取数据的前三行，选取行属性之间的数据（包括了右边属性的数据） 两种方法效果相同

select by label: loc 属性值

# select by label: loc

print(df.loc['20130102'])             #  选取行属性为‘20130102’的数据

print(df.loc[:,['A','B']])            # 选取列属性为‘A’，‘B’的所有数据

print(df.loc['20130102', ['A','B']])  # 选取行属性为‘20130102’，列属性为‘A’，‘B’的数据

select by position: iloc 属性编号

# select by position: iloc

print(df.iloc[3])              # 选取行第4行的数据

print(df.iloc[3, 1])           # 选取第4行第2列的数据

print(df.iloc[3:5,0:2])        # 选取行编号为3,4 列编号为0,1的数据

print(df.iloc[[1,2,4],[0,2]])  # 选取第2,3,5行，第1，3列的数据

mixed selection: ix 标签值+标签标号

# mixed selection: ix

print(df.ix[:3, ['A', 'C']])   # 选取前3行，列属性为‘A’，‘C’的数据

Boolean indexing 布尔

# Boolean indexing

print(df[df.A > 0])            # 选取所有值大于0的数据

下面是所有的输出结果：

print(df)

>                   A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

> 2013-01-04 -0.322417 -0.384054  1.133769 -1.099891

> 2013-01-05 -0.172428 -0.877858  0.042214  0.582815

> 2013-01-06 -1.100619  1.144724  0.901591  0.502494

print(df['A'])

print('\n')

print(df.A)

> 2013-01-01    1.624345

> 2013-01-02    0.865408

> 2013-01-03    0.319039

> 2013-01-04   -0.322417

> 2013-01-05   -0.172428

> 2013-01-06   -1.100619

> Freq: D, Name: A, dtype: float64

> 2013-01-01    1.624345

> 2013-01-02    0.865408

> 2013-01-03    0.319039

> 2013-01-04   -0.322417

> 2013-01-05   -0.172428

> 2013-01-06   -1.100619

> Freq: D, Name: A, dtype: float64

print(df[0:3])

print('\n')

print(df['20130102':'20130104'])

>                    A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

>                    A         B         C         D

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

> 2013-01-04 -0.322417 -0.384054  1.133769 -1.099891

# select by label: loc

print(df.loc['20130102'])

> A    0.865408

> B   -2.301539

> C    1.744812

> D   -0.761207

> Name: 2013-01-02 00:00:00, dtype: float64

print(df.loc[:, ['A', 'B']])

>                    A         B

> 2013-01-01  1.624345 -0.611756

> 2013-01-02  0.865408 -2.301539

> 2013-01-03  0.319039 -0.249370

> 2013-01-04 -0.322417 -0.384054

> 2013-01-05 -0.172428 -0.877858

> 2013-01-06 -1.100619  1.144724

print(df.loc['20130102', ['A', 'B']])

> A    0.865408

> B   -2.301539

> Name: 2013-01-02 00:00:00, dtype: float64

# select by position: iloc

print(df.iloc[3])

> A   -0.322417

> B   -0.384054

> C    1.133769

> D   -1.099891

> Name: 2013-01-04 00:00:00, dtype: float64

print(df.iloc[3, 1])

> -0.38405435466841564

print(df.iloc[3:5, 0:2])

>                    A         B

> 2013-01-04 -0.322417 -0.384054

> 2013-01-05 -0.172428 -0.877858

print(df.iloc[[1, 2, 4], [0, 2]])

                   A         C

2013-01-02  0.865408  1.744812

2013-01-03  0.319039  1.462108

2013-01-05 -0.172428  0.042214

# mixed selection: ix

print(df.ix[:3, ['A', 'C']])

>                    A         C

> 2013-01-01  1.624345 -0.528172

> 2013-01-02  0.865408  1.744812

> 2013-01-03  0.319039  1.462108

# Boolean indexing

print(df[df.A > 0])

>                    A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

END

pandas 2 选择数据的更多相关文章

pandas选择数据-【老鱼学pandas】
选择列根据列名来选择某列的数据 import pandas as pd import numpy as np dates = pd.date_range("2017-01-08" ...
【转】Pandas学习笔记（二）选择数据
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
pandas 学习第14篇：索引和选择数据
数据框和序列结构中都有轴标签,轴标签的信息存储在Index对象中,轴标签的最重要的作用是: 唯一标识数据,用于定位数据用于数据对齐获取和设置数据集的子集. 本文重点关注如何对序列(Series)和 ...
[数据清洗]-使用 Pandas 清洗“脏”数据
概要准备工作检查数据处理缺失数据添加默认值删除不完整的行删除不完整的列规范化数据类型必要的转换重命名列名保存结果更多资源 Pandas 是 Python 中很流行的类库,使用它可 ...
[数据清洗]- Pandas 清洗“脏”数据（三）
预览数据这次我们使用 Artworks.csv ,我们选取 100 行数据来完成本次内容.具体步骤: 导入 Pandas 读取 csv 数据到 DataFrame(要确保数据已经下载到指定路径) D ...
[数据清洗]-Pandas 清洗“脏”数据（一）
概要准备工作检查数据处理缺失数据添加默认值删除不完整的行删除不完整的列规范化数据类型必要的转换重命名列名保存结果更多资源 Pandas 是 Python 中很流行的类库,使用它可 ...
Python 数据分析 - 索引和选择数据
loc,iloc,ix三者间的区别和联系 loc .loc is primarily label based, but may also be used with a boolean array. 就 ...
Pandas透视表处理数据（转）
手把手教你用Pandas透视表处理数据(附学习资料) 2018-01-06 数据派THU 来源:伯乐在线 - PyPer 本文共2203字,建议阅读5分钟.本文重点解释pandas中的函数pivot ...
Pandas怎样新增数据列
Pandas怎样新增数据列? 在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析. 直接赋值 df.apply方法 df.assign方法按条件选择分组分别赋值 0.读取csv ...

随机推荐

Codeforces Round #493 (Div. 1) B. Roman Digits 打表找规律
题意: 我们在研究罗马数字.罗马数字只有4个字符,I,V,X,L分别代表1,5,10,100.一个罗马数字的值为该数字包含的字符代表数字的和,而与字符的顺序无关.例如XXXV=35,IXI=12．现 ...
获得a-b的差[返回BigDecimal 类型]
/*** * 返回 a-b 的差 [返回 BigDecimal 类型] * @param a 被减数 * @param b 减数 * @return */ public static BigDecim ...
[置顶] 谷歌大牛 Jeff Dean 是如何成为互联网战神的
谷歌大牛 Jeff Dean 是如何成为互联网战神的原文链接: Will Oremus 翻译: 伯乐在线- Lex Lian 译文链接: http://blog.jobbole.com/4772 ...
php 密码hash加密
做密码加密,记录一下. password_hash 函数在 PHP 5.5 时被引入. 此函数现在使用的是目前 PHP 所支持的最强大的加密算法 BCrypt .例子: $passwordHash = ...
浅谈 Qt 布局那些事
Qt 布局那些事是本文介绍的内容,直接进入主题.GridLayout是一个非常强大的布局管理器,它可以实现很多复杂的布局,名字中暗示它将所有控件放置在类似网格的布局中.^__^GridLayout有两 ...
安装NexT主题
Hexo 安装主题的方式非常简单,只需要将主题文件拷贝至站点目录的 themes 目录下, 然后修改下配置文件即可. 下载主题包在终端窗口下,定位到 Hexo 站点目录下.使用 Git checko ...
在MAC下怎样用SSH连接远程LINUXserver
首页,打开MAC的命令终端,检查是不是用root用的登录的,假设不是的话请输入命令:sudo -i切换到root. 然后,输入:ssh ip地址,假设主机存在的话会提示你输入password,输入正确 ...
bzoj4590: [Shoi2015]自动刷题机(二分答案)
4590: [Shoi2015]自动刷题机题目:传送门题解: 很明显的一道二分题. 对于二分性的判断:如果n越大,那么AC的题就越少,n越小,AC的题就越多,那么最大最小值都满足单调性,直接瞎搞. ...
bzoj5105: [CodePlus2017]晨跑（LCM）
5105: [CodePlus2017]晨跑题目:传送门题解: 没有很懂Code Puls 的操作...一道签到的三个数的LCM??? 代码: #include<cstdio> #in ...
16.boost图深度优先遍历DFS
#include <iostream> #include <boost/config.hpp> //图(矩阵实现) #include <boost/graph/adjac ...

pandas 2 选择数据

select by label: loc 属性值

select by position: iloc 属性编号

mixed selection: ix 标签值+标签标号

Boolean indexing 布尔

pandas 2 选择数据的更多相关文章

随机推荐

热门专题