pandas 2 选择数据

from __future__ import print_function

import pandas as pd

import numpy as np

np.random.seed(1)

dates = pd.date_range('20130101', periods=6)

df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=['A', 'B', 'C', 'D'])

print(df['A'], df.A)                       # 选取属性值为‘A’的列，两种方法效果相同

print(df[0:3], df['20130102':'20130104'])  # 选取数据的前三行，选取行属性之间的数据（包括了右边属性的数据） 两种方法效果相同

select by label: loc 属性值

# select by label: loc

print(df.loc['20130102'])             #  选取行属性为‘20130102’的数据

print(df.loc[:,['A','B']])            # 选取列属性为‘A’，‘B’的所有数据

print(df.loc['20130102', ['A','B']])  # 选取行属性为‘20130102’，列属性为‘A’，‘B’的数据

select by position: iloc 属性编号

# select by position: iloc

print(df.iloc[3])              # 选取行第4行的数据

print(df.iloc[3, 1])           # 选取第4行第2列的数据

print(df.iloc[3:5,0:2])        # 选取行编号为3,4 列编号为0,1的数据

print(df.iloc[[1,2,4],[0,2]])  # 选取第2,3,5行，第1，3列的数据

mixed selection: ix 标签值+标签标号

# mixed selection: ix

print(df.ix[:3, ['A', 'C']])   # 选取前3行，列属性为‘A’，‘C’的数据

Boolean indexing 布尔

# Boolean indexing

print(df[df.A > 0])            # 选取所有值大于0的数据

下面是所有的输出结果：

print(df)

>                   A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

> 2013-01-04 -0.322417 -0.384054  1.133769 -1.099891

> 2013-01-05 -0.172428 -0.877858  0.042214  0.582815

> 2013-01-06 -1.100619  1.144724  0.901591  0.502494

print(df['A'])

print('\n')

print(df.A)

> 2013-01-01    1.624345

> 2013-01-02    0.865408

> 2013-01-03    0.319039

> 2013-01-04   -0.322417

> 2013-01-05   -0.172428

> 2013-01-06   -1.100619

> Freq: D, Name: A, dtype: float64

> 2013-01-01    1.624345

> 2013-01-02    0.865408

> 2013-01-03    0.319039

> 2013-01-04   -0.322417

> 2013-01-05   -0.172428

> 2013-01-06   -1.100619

> Freq: D, Name: A, dtype: float64

print(df[0:3])

print('\n')

print(df['20130102':'20130104'])

>                    A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

>                    A         B         C         D

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

> 2013-01-04 -0.322417 -0.384054  1.133769 -1.099891

# select by label: loc

print(df.loc['20130102'])

> A    0.865408

> B   -2.301539

> C    1.744812

> D   -0.761207

> Name: 2013-01-02 00:00:00, dtype: float64

print(df.loc[:, ['A', 'B']])

>                    A         B

> 2013-01-01  1.624345 -0.611756

> 2013-01-02  0.865408 -2.301539

> 2013-01-03  0.319039 -0.249370

> 2013-01-04 -0.322417 -0.384054

> 2013-01-05 -0.172428 -0.877858

> 2013-01-06 -1.100619  1.144724

print(df.loc['20130102', ['A', 'B']])

> A    0.865408

> B   -2.301539

> Name: 2013-01-02 00:00:00, dtype: float64

# select by position: iloc

print(df.iloc[3])

> A   -0.322417

> B   -0.384054

> C    1.133769

> D   -1.099891

> Name: 2013-01-04 00:00:00, dtype: float64

print(df.iloc[3, 1])

> -0.38405435466841564

print(df.iloc[3:5, 0:2])

>                    A         B

> 2013-01-04 -0.322417 -0.384054

> 2013-01-05 -0.172428 -0.877858

print(df.iloc[[1, 2, 4], [0, 2]])

                   A         C

2013-01-02  0.865408  1.744812

2013-01-03  0.319039  1.462108

2013-01-05 -0.172428  0.042214

# mixed selection: ix

print(df.ix[:3, ['A', 'C']])

>                    A         C

> 2013-01-01  1.624345 -0.528172

> 2013-01-02  0.865408  1.744812

> 2013-01-03  0.319039  1.462108

# Boolean indexing

print(df[df.A > 0])

>                    A         B         C         D

> 2013-01-01  1.624345 -0.611756 -0.528172 -1.072969

> 2013-01-02  0.865408 -2.301539  1.744812 -0.761207

> 2013-01-03  0.319039 -0.249370  1.462108 -2.060141

END

pandas 2 选择数据的更多相关文章

pandas选择数据-【老鱼学pandas】
选择列根据列名来选择某列的数据 import pandas as pd import numpy as np dates = pd.date_range("2017-01-08" ...
【转】Pandas学习笔记（二）选择数据
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
pandas 学习第14篇：索引和选择数据
数据框和序列结构中都有轴标签,轴标签的信息存储在Index对象中,轴标签的最重要的作用是: 唯一标识数据,用于定位数据用于数据对齐获取和设置数据集的子集. 本文重点关注如何对序列(Series)和 ...
[数据清洗]-使用 Pandas 清洗“脏”数据
概要准备工作检查数据处理缺失数据添加默认值删除不完整的行删除不完整的列规范化数据类型必要的转换重命名列名保存结果更多资源 Pandas 是 Python 中很流行的类库,使用它可 ...
[数据清洗]- Pandas 清洗“脏”数据（三）
预览数据这次我们使用 Artworks.csv ,我们选取 100 行数据来完成本次内容.具体步骤: 导入 Pandas 读取 csv 数据到 DataFrame(要确保数据已经下载到指定路径) D ...
[数据清洗]-Pandas 清洗“脏”数据（一）
概要准备工作检查数据处理缺失数据添加默认值删除不完整的行删除不完整的列规范化数据类型必要的转换重命名列名保存结果更多资源 Pandas 是 Python 中很流行的类库,使用它可 ...
Python 数据分析 - 索引和选择数据
loc,iloc,ix三者间的区别和联系 loc .loc is primarily label based, but may also be used with a boolean array. 就 ...
Pandas透视表处理数据（转）
手把手教你用Pandas透视表处理数据(附学习资料) 2018-01-06 数据派THU 来源:伯乐在线 - PyPer 本文共2203字,建议阅读5分钟.本文重点解释pandas中的函数pivot ...
Pandas怎样新增数据列
Pandas怎样新增数据列? 在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析. 直接赋值 df.apply方法 df.assign方法按条件选择分组分别赋值 0.读取csv ...

随机推荐

Pyhton二级操作题练习
# 1.编写一个python程序,输入两个数,比较它们的大小并输出其中较大者. num1 = input('请输入数字X:') num2 = input('请输入数字Y:') if num1.isde ...
Model、ModelMap和ModelAndView的使用详解
https://blog.csdn.net/itbiggod/article/details/79685610
12、Camel: Content-Aware and Meta-path Augmented Metric Learning for Author Identification----作者识别
摘自:https://blog.csdn.net/me_yundou/article/details/80459341 具体看上面链接一.摘要: 这篇文章主要介绍的是作者识别(author iden ...
centos7下安装pyspark
1.安装python 2.安装jdk 3.下载spark:http://spark.apache.org/downloads.html, 下载新版(spark-2.3.1-bin-hadoop2.7. ...
POJ 3370 Halloween treats（鸽巢原理简单题）
链接:传送门题意:万圣节到了,有 c 个小朋友向 n 个住户要糖果,根据以往的经验,第i个住户会给他们a[ i ]颗糖果,但是为了和谐起见,小朋友们决定要来的糖果要能平分,所以他们只会选择一部分住户 ...
查看Linux系统信息命令
系统 # uname -a # 查看内核/操作系统/CPU信息 # head -n 1 /etc/issue # 查看操作系统版本 # cat /proc/cpuinfo # 查看CPU信息 # ho ...
webpack加载器（Loaders）
加载器(Loaders) loader 是对应用程序中资源文件进行转换.它们是(运行在 Node.js 中的)函数,可以将资源文件作为参数的来源,然后返回新的资源文件. 示例例如,你可以使用 loa ...
ASP.NET-属性与过滤器
目的:在调用操作之前或者之后执行特定的逻辑代码系统定义: 1.日志记录 2.防图像盗链 3.爬虫 4.本地化,用于设定区域设置 5.动态操作,用于将操作注入到控制器当中用来过滤HTTP请求高级 ...
POJ——T2421 Constructing Roads
http://poj.org/problem?id=2421 Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 24132 ...
error: could not install *smartsocket* listener: Address already in use 下午8:49 ADB server didn't ACK 下午8:49 * failed to start daemon * 下午8:49 error: cannot connect to daemon
在终端输入adb命令,出错如下: localhost:work zhangyg$ adb devices List of devices attached adb server version (32 ...

pandas 2 选择数据

select by label: loc 属性值

select by position: iloc 属性编号

mixed selection: ix 标签值+标签标号

Boolean indexing 布尔

pandas 2 选择数据的更多相关文章

随机推荐

热门专题