numpy和pandas的基础索引切片

Numpy的索引切片

索引

In [72]: arr = np.array([[[1,1,1],[2,2,2]],[[3,3,3],[4,4,4]]])                 

In [73]: arr

Out[73]:

array([[[1, 1, 1],

        [2, 2, 2]],

       [[3, 3, 3],

        [4, 4, 4]]])

In [74]: arr.ndim

Out[74]: 3

In [75]: arr.shape

Out[75]: (2, 2, 3)

In [76]: arr[0]           #返回降低一个维度的数组

Out[76]:

array([[1, 1, 1],

       [2, 2, 2]])

In [77]: arr[0,0] #返回一维数组
Out[77]: array([1, 1, 1])

切片

In [78]: arr[:,:,:2]

Out[78]:

array([[[1, 1],

        [2, 2]],

       [[3, 3],

        [4, 4]]])

索引与切片结合

array([[[1, 1, 1],

        [2, 2, 2]],

       [[3, 3, 3],

        [4, 4, 4]]])

In [79]: arr[0,1,:2]

Out[79]: array([2, 2])

Pandas的索引切片

一、Series的索引

In [8]: obj = pd.Series(np.arange(4),index=['a','b','c','d'])                  

In [9]: obj

Out[9]:

a    0

b    1

c    2

d    3

dtype: int64

1）使用index进行索引

In [10]: obj['b']

Out[10]: 1

In [11]: obj[1]

Out[11]: 1

2）切片

In [12]: obj['b':'d']    #包含尾部

Out[12]:

b    1

c    2

d    3

dtype: int64

In [13]: obj[1:3]

Out[13]:

b    1

c    2

dtype: int64

3）使用索引列表进行索引

In [14]: obj[['b','d']]

Out[14]:

b    1

d    3

dtype: int64

In [15]: obj[[1,3]]

Out[15]:

b    1

d    3

dtype: int64

二、DataFrame的索引

In [20]: obj = pd.DataFrame(np.arange(16).reshape((4,4)),index=['a','b','c','d'

    ...: ],columns=['a1','b2','c3','d4'])    
 

In [21]: obj

Out[21]:

   a1  b2  c3  d4

a   0   1   2   3

b   4   5   6   7

c   8   9  10  11

d  12  13  14  15

1）索引列

不可以obj[‘a’]了

In [32]: obj['b2']

Out[32]:

a     1

b     5

c     9

d    13

Name: b2, dtype: int64

2）行切片

In [36]: obj[:3]

Out[36]:

   a1  b2  c3  d4

a   0   1   2   3

b   4   5   6   7

c   8   9  10  11

In [37]: obj[obj['c3']>6]  #根据布尔值数组选择数据

Out[37]:

   a1  b2  c3  d4

c   8   9  10  11

d  12  13  14  15

3）索引列和行

In [38]: obj['a1']['c']

Out[38]: 8

In [39]: obj['a1'][:2]

Out[39]:

a    0

b    4

Name: a1, dtype: int64

4）使用loc和iloc选择数据

使用轴标签（loc）或整数标签（iloc）从DataFrame中选出数组的行和列的子集

整数标签（iloc）：

In [55]: obj

Out[55]:

   a1  b2  c3  d4

a   0   1   2   3

b   4   5   6   7

c   8   9  10  11

d  12  13  14  15

In [53]: obj.iloc[2,[2,0,1]]  #变换列顺序

Out[53]:

c3    10

a1     8

b2     9

Name: c, dtype: int64

In [54]: obj.iloc[2]         #索引行

Out[54]:

a1     8

b2     9

c3    10

d4    11

Name: c, dtype: int64

轴标签（loc）：

In [57]: obj.loc['a',['b2','a1']]

Out[57]:

b2    1

a1    0

Name: a, dtype: int64

In [58]: obj.loc['a':'c',['b2','a1']]                                          

Out[58]:

   b2  a1

a   1   0

b   5   4

c   9   8

numpy和pandas的基础索引切片的更多相关文章

python中pandas数据分析基础3（数据索引、数据分组与分组运算、数据离散化、数据合并）
//2019.07.19/20 python中pandas数据分析基础(数据重塑与轴向转化.数据分组与分组运算.离散化处理.多数据文件合并操作) 3.1 数据重塑与轴向转换1.层次化索引使得一个轴上拥 ...
Numpy 笔记: 多维数组的切片(slicing)和索引(indexing)【转】
目录切片(slicing)操作索引(indexing) 操作最简单的情况获取多个元素切片和索引的同异切片(slicing)操作 Numpy 中多维数组的切片操作与 Python 中 lis ...
Python array,list,dataframe索引切片操作 2016年07月19日——智浪文档
array,list,dataframe索引切片操作 2016年07月19日——智浪文档 list,一维,二维array,datafrme,loc.iloc.ix的简单探讨 Numpy数组的索引和切片 ...
《Python数据分析常用手册》一、NumPy和Pandas篇
一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/ ...
【转】python 中NumPy和Pandas工具包中的函数使用笔记（方便自己查找）
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...
python 中NumPy和Pandas工具包中的函数使用笔记（方便自己查找）
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...
NumPy和Pandas常用库
NumPy和Pandas常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数 ...
05-pandas索引切片读取数据缺失数据处理
引入 numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够很多时候, ...
常用numpy和pandas
常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准数学 ...

随机推荐

protobuf 的enum与string转换
c/c++ enum 介绍说起c/c++ 的enum,比起python 真的是方便简洁 enum type{ type1 = 0, type2 } enum的元素对应的int 默认从0 开始依次增加 ...
Python 重新加载模块
每个Python文件中的import modulename只被加载一遍,如果在运行过程中,这个Module被更改了,即使在在interpretor中运行import 语句也没用. 可以使用import ...
CentOS7下MySQL8的二进制基本安装配置
前言基于本地Centos7.6虚拟机Mysql8的配置(亲测有效) 一.安装前的准备 1.到官网下载mysql-8.0.16-linux-glibc2.12-x86_64.tar.xz 2.通过Xs ...
java类的实例化顺序
1．父类静态成员和静态初始化块 ,按在代码中出现的顺序依次执行 2．子类静态成员和静态初始化块 ,按在代码中出现的顺序依次执行 3．父类实例成员和实例初始化块 ,按在代码中出现的顺序依次执行 4 ...
JVM探秘：jmap生成内存堆转储快照
本系列笔记主要基于<深入理解Java虚拟机:JVM高级特性与最佳实践第2版>,是这本书的读书笔记. jmap 命令用来生成内存堆转储快照,一般称为heapdump或dump文件. 除了使 ...
Python批量重命名文件
批量替换文件名中重复字符: # -*- coding: UTF-8 -*- import os path = raw_input("请输入文件夹路径:") oldname = ra ...
HTML5中的data-*属性
data-* 属性包括两部分: 属性名不应该包含任何大写字母,并且在前缀 "data-" 之后必须有至少一个字符: 属性值可以是任意字符串: 注释:用户代理会完全忽略前缀为 &qu ...
Hadoop_课堂笔记1
1.课程目标实践性 2.课下需要在家搭建一个伪分布式 3.大数据概念和意义 08年Nature第一次正式提出大数据概念常规的数据库:结构化的数据库 TB级的结构化数据管理就很困难,需要分布式当 ...
嵌入式c语言编码规范
学习嵌入式的同学应该首先掌握嵌入式编码规范,这样才能更好的嵌入式系统. 下面就从这几个方面讲解一下嵌入式c编码规范. 注释风格.排版风格.头文件风格.变量定义.宏定义.函数 1 注释风格 1.1 注 ...
CaptchaCodeManager
package org.linlinjava.litemall.wx.service; import org.linlinjava.litemall.wx.dto.CaptchaItem; impor ...

numpy和pandas的基础索引切片

Numpy的索引切片

Pandas的索引切片

numpy和pandas的基础索引切片的更多相关文章

随机推荐

热门专题