pandas之数据选择

pandas中有三种索引方法：.loc，.iloc和[]，注意：.ix的用法在0.20.0中已经不建议使用了

import pandas as pd

import numpy as np

In [5]:

dates = pd.date_range("20170101",periods=6)

df1 = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=["A","B","C","D"])

df1

Out[5]:

	A	B	C	D
2017-01-01	0	1	2	3
2017-01-02	4	5	6	7
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15
2017-01-05	16	17	18	19
2017-01-06	20	21	22	23

In [6]:

将dataframe的列获取为一个series

df1["A"]#将dataframe的列获取为一个series

Out[6]:

2017-01-01     0

2017-01-02     4

2017-01-03     8

2017-01-04    12

2017-01-05    16

2017-01-06    20

Freq: D, Name: A, dtype: int32

In [7]:

df1.A#另一种获取

Out[7]:

2017-01-01     0

2017-01-02     4

2017-01-03     8

2017-01-04    12

2017-01-05    16

2017-01-06    20

Freq: D, Name: A, dtype: int32

In [8]:

切片，获取前2行

df1[0:2]#切片，获取前2行

Out[8]:

	A	B	C	D
2017-01-01	0	1	2	3
2017-01-02	4	5	6	7

In [9]:

通过索引获取指定行

df1["20170102":"20170104"]#通过索引获取指定行

Out[9]:

	A	B	C	D
2017-01-02	4	5	6	7
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15

In [11]:

通过标签选择数据

#通过标签选择数据

df1.loc["20170102"]

Out[11]:

A    4

B    5

C    6

D    7

Name: 2017-01-02 00:00:00, dtype: int32

In [12]:

提取某个行的指定列

df1.loc["20170102",["A","C"]]#提取某个行的指定列

Out[12]:

A    4

C    6

Name: 2017-01-02 00:00:00, dtype: int32

In [13]:

df1.loc[:,["A","B"]]

Out[13]:

	A	B
2017-01-01	0	1
2017-01-02	4	5
2017-01-03	8	9
2017-01-04	12	13
2017-01-05	16	17
2017-01-06	20	21

In [14]:

通过位置选择数据

#通过位置选择数据

df1.iloc[2]#提取第二行

Out[14]:

A     8

B     9

C    10

D    11

Name: 2017-01-03 00:00:00, dtype: int32

In [15]:

df1.iloc[1:3,2:4]

Out[15]:

	C	D
2017-01-02	6	7
2017-01-03	10	11

In [18]:

提取不连续的行和列

#提取不连续的行和列

df1.iloc[[1,2,4],[1,3]]

Out[18]:

	B	D
2017-01-02	5	7
2017-01-03	9	11
2017-01-05	17	19

In [20]:

#混合标签位置选择

df1.ix[2:4,["A","C"]]

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\ipykernel_launcher.py:2: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\pandas\core\indexing.py:808: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

  retval = getattr(retval, self.name)._getitem_axis(key, axis=i)

Out[20]:

	A	C
2017-01-03	8	10
2017-01-04	12	14

In [23]:

df1.ix["20170102":"20170104",2:4]

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\ipykernel_launcher.py:1: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

  """Entry point for launching an IPython kernel.

Out[23]:

	C	D
2017-01-02	6	7
2017-01-03	10	11
2017-01-04	14	15

In [24]:

判断某一行的值大小

#判断某一行的值大小

df1.A >6

Out[24]:

2017-01-01    False

2017-01-02    False

2017-01-03     True

2017-01-04     True

2017-01-05     True

2017-01-06     True

Freq: D, Name: A, dtype: bool

In [25]:

df1[df1.A>6]#根据判断组成新的DataFrame

Out[25]:

	A	B	C	D
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15
2017-01-05	16	17	18	19
2017-01-06	20	21	22	23

In [ ]:

pandas之数据选择的更多相关文章

Pandas:DataFrame数据选择方法（索引）
#首先创建我们的Series对象,然后合并到dataframe对象里面去 import pandas as pd import numpy as np area=pd.Series({,,,}) po ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
基于pandas进行数据预处理
很久没用pandas,有些有点忘了,转载一个比较完整的利用pandas进行数据预处理的博文:https://blog.csdn.net/u014400239/article/details/70846 ...
pandas 新增数据列（直接赋值、apply，assign、分条件赋值）
# pandas新增数据列(直接赋值.apply.assign.分条件赋值) # pandas在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析 # 1 直接赋值 # 2 df. ...
python-数据描述与分析2（利用Pandas处理数据缺失值的处理数据库的使用）
2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后,接下来就是如何处理数据,虽然之前的赋值计算也是一种计算,但是如果Pandas的作用就停留在此,那我们也许只是看到了它的冰山一角,它 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...

随机推荐

第十三章·Kibana深入-使用地图统计客户端IP
地址库在ELK中,我们可以使用地址库,来对IP进行分析,对日志进行分析,在ELKstack中只有Logstash可以做到,但是出图,是Kibana来出的,所以我们首先需要下载地址库数据文件,然后对L ...
yocto 项目编译
1. 编译整个项目构建编译环境: ~/fsl_6dl_release$ MACHINE=imx6dlsabresd source fsl-setup-release.sh -b build-wayl ...
Vue快速学习_第四节
获取原生的DOM方式($.refs) 给标签或者组件添加ref <div ref = 'liu'>test</div> <Home ref = 'home'>&l ...
shutdown immediate 持久无法关闭数据库之解决方案
问题引出:测试环境,进行oralce的shutdown immediate,等待时间很长,长的无法等待 ORACLE shutdown 过程: 1.shutdown normal(正常关闭方式):阻止 ...
TF启程
我第一次开始接触到TensorFlow大概是去年五月份,大三下,如果一年多已过,我却还在写启程..这进度,实在汗颜.. 一个完整的tensorflow程序可以分为以下几部分: Inputs and P ...
git生成公钥public key并添加SSH key。git乌龟gerrit下推送git【server sent :publickey】
一.key 码云链接:http://git.mydoc.io/?t=180845#text_180845 博客链接: 方式一:https://blog.csdn.net/xb12369/article ...
wcPro--WordCount扩展
Github:https://github.com/whoNamedCody/wcPro PSP表格 PSP2.1 PSP阶段预估耗时 (分钟) 实际耗时 (分钟) Planning 计划 ...
ZAP笔记
1.HTTP自动变成HTTS问题. 在使用OWASP ZAP 2.8.0的时候,如果设置了dynamic ssl certificates,并把正式导入到浏览器的时候如果ZAP当做代理访问HTTP的 ...
Java进阶知识01 Struts2下的 jquery+ajax+struts 技术实现异步刷新功能
1.效果图示横线上方的部分不动(没有刷新),下方实现刷新(异步刷新) 2.实现步骤 jquery+ajax+struts技术实现异步刷新功能的步骤: 1.需要用到 jquery+ajax+st ...
『HGOI 20190917』Lefkaritika 题解 (DP)
题目概述一个$n \times m$的整点集.其中$q$个点被m被设置为不能访问. 问这个点集中含有多少个不同的正方形,满足不包含任何一个不能访问的点. 对于$50\%$的数据满足$1 \leq n ...