Numpy的索引切片

索引

In [72]: arr = np.array([[[1,1,1],[2,2,2]],[[3,3,3],[4,4,4]]])                 

In [73]: arr
Out[73]:
array([[[1, 1, 1],
[2, 2, 2]], [[3, 3, 3],
[4, 4, 4]]]) In [74]: arr.ndim
Out[74]: 3 In [75]: arr.shape
Out[75]: (2, 2, 3) In [76]: arr[0] #返回降低一个维度的数组
Out[76]:
array([[1, 1, 1],
[2, 2, 2]])

In [77]: arr[0,0]         #返回一维数组
  Out[77]: array([1, 1, 1])

切片

In [78]: arr[:,:,:2]
Out[78]:
array([[[1, 1],
[2, 2]], [[3, 3],
[4, 4]]])

索引与切片结合

array([[[1, 1, 1],
[2, 2, 2]],
[[3, 3, 3],
[4, 4, 4]]])
In [79]: arr[0,1,:2]
Out[79]: array([2, 2])

Pandas的索引切片

一、Series的索引

In [8]: obj = pd.Series(np.arange(4),index=['a','b','c','d'])                  

In [9]: obj
Out[9]:
a 0
b 1
c 2
d 3
dtype: int64

1)使用index进行索引

In [10]: obj['b']
Out[10]: 1 In [11]: obj[1]
Out[11]: 1

2)切片

In [12]: obj['b':'d']    #包含尾部
Out[12]:
b 1
c 2
d 3
dtype: int64 In [13]: obj[1:3]
Out[13]:
b 1
c 2
dtype: int64

3)使用索引列表进行索引

In [14]: obj[['b','d']]
Out[14]:
b 1
d 3
dtype: int64 In [15]: obj[[1,3]]
Out[15]:
b 1
d 3
dtype: int64

二、DataFrame的索引

In [20]: obj = pd.DataFrame(np.arange(16).reshape((4,4)),index=['a','b','c','d'
...: ],columns=['a1','b2','c3','d4'])

In [21]: obj
Out[21]:
a1 b2 c3 d4
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15

1)索引列

不可以obj[‘a’]了

In [32]: obj['b2']
Out[32]:
a 1
b 5
c 9
d 13
Name: b2, dtype: int64

2)行切片

In [36]: obj[:3]
Out[36]:
a1 b2 c3 d4
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11 In [37]: obj[obj['c3']>6] #根据布尔值数组选择数据
Out[37]:
a1 b2 c3 d4
c 8 9 10 11
d 12 13 14 15

3)索引列和行

In [38]: obj['a1']['c']
Out[38]: 8 In [39]: obj['a1'][:2]
Out[39]:
a 0
b 4
Name: a1, dtype: int64

4)使用loc和iloc选择数据

使用轴标签(loc)或整数标签(iloc)从DataFrame中选出数组的行和列的子集

整数标签(iloc):

In [55]: obj
Out[55]:
a1 b2 c3 d4
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15 In [53]: obj.iloc[2,[2,0,1]] #变换列顺序
Out[53]:
c3 10
a1 8
b2 9
Name: c, dtype: int64 In [54]: obj.iloc[2] #索引行
Out[54]:
a1 8
b2 9
c3 10
d4 11
Name: c, dtype: int64

轴标签(loc):

In [57]: obj.loc['a',['b2','a1']]
Out[57]:
b2 1
a1 0
Name: a, dtype: int64 In [58]: obj.loc['a':'c',['b2','a1']] Out[58]:
b2 a1
a 1 0
b 5 4
c 9 8

numpy和pandas的基础索引切片的更多相关文章

  1. python中pandas数据分析基础3(数据索引、数据分组与分组运算、数据离散化、数据合并)

    //2019.07.19/20 python中pandas数据分析基础(数据重塑与轴向转化.数据分组与分组运算.离散化处理.多数据文件合并操作) 3.1 数据重塑与轴向转换1.层次化索引使得一个轴上拥 ...

  2. Numpy 笔记: 多维数组的切片(slicing)和索引(indexing)【转】

    目录 切片(slicing)操作 索引(indexing) 操作 最简单的情况 获取多个元素 切片和索引的同异 切片(slicing)操作 Numpy 中多维数组的切片操作与 Python 中 lis ...

  3. Python array,list,dataframe索引切片操作 2016年07月19日——智浪文档

    array,list,dataframe索引切片操作 2016年07月19日——智浪文档 list,一维,二维array,datafrme,loc.iloc.ix的简单探讨 Numpy数组的索引和切片 ...

  4. 《Python数据分析常用手册》一、NumPy和Pandas篇

    一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/ ...

  5. 【转】python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)

    二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...

  6. python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)

    二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...

  7. NumPy和Pandas常用库

    NumPy和Pandas常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数 ...

  8. 05-pandas索引切片读取数据缺失数据处理

    引入 numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够 很多时候, ...

  9. 常用numpy和pandas

    常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准数学 ...

随机推荐

  1. protobuf 的enum与string转换

    c/c++ enum 介绍 说起c/c++ 的enum,比起python 真的是方便简洁 enum type{ type1 = 0, type2 } enum的元素对应的int 默认从0 开始依次增加 ...

  2. Python 重新加载模块

    每个Python文件中的import modulename只被加载一遍,如果在运行过程中,这个Module被更改了,即使在在interpretor中运行import 语句也没用. 可以使用import ...

  3. CentOS7下MySQL8的二进制基本安装配置

    前言 基于本地Centos7.6虚拟机Mysql8的配置(亲测有效) 一.安装前的准备 1.到官网下载mysql-8.0.16-linux-glibc2.12-x86_64.tar.xz 2.通过Xs ...

  4. java类的实例化顺序

    1. 父类静态成员和静态初始化块 ,按在代码中出现的顺序依次执行 2. 子类静态成员和静态初始化块 ,按在代码中出现的顺序依次执行 3. 父类实例成员和实例初始化块 ,按在代码中出现的顺序依次执行 4 ...

  5. JVM探秘:jmap生成内存堆转储快照

    本系列笔记主要基于<深入理解Java虚拟机:JVM高级特性与最佳实践 第2版>,是这本书的读书笔记. jmap 命令用来生成内存堆转储快照,一般称为heapdump或dump文件. 除了使 ...

  6. Python批量重命名文件

    批量替换文件名中重复字符: # -*- coding: UTF-8 -*- import os path = raw_input("请输入文件夹路径:") oldname = ra ...

  7. HTML5中的data-*属性

    data-* 属性包括两部分: 属性名不应该包含任何大写字母,并且在前缀 "data-" 之后必须有至少一个字符: 属性值可以是任意字符串: 注释:用户代理会完全忽略前缀为 &qu ...

  8. Hadoop_课堂笔记1

    1.课程目标 实践性 2.课下需要 在家搭建一个伪分布式 3.大数据概念和意义 08年Nature第一次正式提出大数据概念 常规的数据库:结构化的数据库 TB级的结构化数据管理就很困难,需要分布式 当 ...

  9. 嵌入式c语言编码规范

    学习嵌入式的同学应该首先掌握嵌入式编码规范,这样才能更好的嵌入式系统. 下面就从这几个方面讲解一下嵌入式c编码规范. 注释风格.排版风格.头文件风格.变量定义.宏定义.函数 1 注释风格 1.1  注 ...

  10. CaptchaCodeManager

    package org.linlinjava.litemall.wx.service; import org.linlinjava.litemall.wx.dto.CaptchaItem; impor ...