pandas-04 多级index操作

在pandas中可以为series和dataframe设置多个index,也就是说可以有多级index和column。这样可以对pandas的操作更加灵活。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame np.random.seed(666)
# series 中的 index
s1 = Series(np.random.randn(6), index=[['1', '1', '1', '2', '2', '2'], ['a', 'b', 'c', 'a', 'b', 'c']])
print(s1)
'''
1 a 0.824188
b 0.479966
c 1.173468
2 a 0.909048
b -0.571721
c -0.109497
dtype: float64
''' print(s1['1']) # 可以 获取 index 为 1 的 series
'''
a 0.824188
b 0.479966
c 1.173468
dtype: float64
''' print(s1['1']['a']) # 0.8241880833175302 print(s1[:, 'a'])
''' 同样是一个 series
1 0.824188
2 0.909048
dtype: float64
''' # 多级的Series, 可以转化为一个 dataframe
df1 = s1.unstack() # 二级series 可以转化dataframe
print(df1)
'''
a b c
1 0.824188 0.479966 1.173468
2 0.909048 -0.571721 -0.109497
''' df2 = DataFrame([s1['1'], s1['2']])
print(df2)
'''
a b c
0 0.824188 0.479966 1.173468
1 0.909048 -0.571721 -0.109497
''' # dataframe 转化为 series
s2 = df1.unstack()
print(s2)
'''
a 1 0.824188
2 0.909048
b 1 0.479966
2 -0.571721
c 1 1.173468
2 -0.109497
dtype: float64
'''
s2 = df1.T.unstack()
print(s2)
'''
1 a 0.824188
b 0.479966
c 1.173468
2 a 0.909048
b -0.571721
c -0.109497
dtype: float64
''' # 创建 一个 多级的 dataframe
df = DataFrame(np.arange(16).reshape(4, 4), index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]], \
columns=[['beijing', 'beijing', 'shanghai', 'shanghai'], [8, 9, 8, 9]]
)
print(df)
'''
beijing shanghai
8 9 8 9
a 1 0 1 2 3
2 4 5 6 7
b 1 8 9 10 11
2 12 13 14 15
''' # 访问 多级 dataframe 的元素
print(df['beijing']) # 返回 也是一个 dataframe
'''
8 9
a 1 0 1
2 4 5
b 1 8 9
2 12 13
''' print(df['beijing'][8]) # 访问dataframe和访问Series的方法一样
'''
a 1 0
2 4
b 1 8
2 12
Name: 8, dtype: int64
'''

pandas-04 多级index操作的更多相关文章

  1. 利用SolrJ操作solr API完成index操作

    使用SolrJ操作Solr会比利用httpClient来操作Solr要简单.SolrJ是封装了httpClient方法,来操作solr的API的.SolrJ底层还是通过使用httpClient中的方法 ...

  2. ES6.3.2 index操作源码流程

    ES 6.3.2 index 操作源码流程 client 发送请求 TransportBulkAction#doExecute(Task,BulkRequest,listener) 解析请求,是否要自 ...

  3. ElasticSearch Index操作源码分析

    ElasticSearch Index操作源码分析 本文记录ElasticSearch创建索引执行源码流程.从执行流程角度看一下创建索引会涉及到哪些服务(比如AllocationService.Mas ...

  4. python. pandas(series,dataframe,index) method test

    python. pandas(series,dataframe,index,reindex,csv file read and write) method test import pandas as ...

  5. pandas数据结构之DataFrame操作

    这一次我的学习笔记就不直接用官方文档的形式来写了了,而是写成类似于“知识图谱”的形式,以供日后参考. 下面是所谓“知识图谱”,有什么用呢? 1.知道有什么操作(英文可以不看) 2.展示本篇笔记的结构 ...

  6. pandas数据结构之series操作

    阅读之前假定你已经有了python内置的list和dict的基础.这里内容几乎是官方文档的翻译版本.   概览: ​   原来的文档是在一个地方,那边的代码看起来舒服些   https://www.y ...

  7. pandas(一)操作Series和DataFrame的基本功能

    reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 >>> series_obj = Series([4. ...

  8. Pandas | 04 Panel 面板

    面板(Panel)是3D容器的数据.面板数据一词来源于计量经济学,部分源于名称:Pandas - pan(el)-da(ta)-s. 3轴(axis)这个名称旨在给出描述涉及面板数据的操作的一些语义. ...

  9. Pandas 之 DataFrame 常用操作

    import numpy as np import pandas as pd This section will walk you(引导你) through the fundamental(基本的) ...

随机推荐

  1. python skimage图像处理(三)

    python skimage图像处理(三) This blog is from: https://www.jianshu.com/p/7693222523c0  霍夫线变换 在图片处理中,霍夫变换主要 ...

  2. Mesa: GeoReplicated, Near RealTime, Scalable Data Warehousing

    Mesa的定义并没有反映出他的特点,因为分布式,副本,高可用,他都是依赖google的其他基础设施完成的 他最大的特点是,和传统数仓比,可以做到near real-time的返回聚合的查询结果 算入实 ...

  3. 【APM】Pinpoint 安装部署(一)

    Pinpoint简介 Pinpoint是用Java / PHP编写的大规模分布式系统的APM(应用程序性能管理)工具.受Dapper的启发,Pinpoint提供了一种解决方案,可通过跟踪跨分布式应用程 ...

  4. Qt开发经验小技巧41-50

    如果使用sqlite数据库不想产生数据库文件,可以创建内存数据库. QSqlDatabase db = QSqlDatabase::addDatabase("QSQLITE"); ...

  5. Hive、Inceptor数据倾斜详解及解决

    一.倾斜造成的原因 正常的数据分布理论上都是倾斜的,就是我们所说的20-80原理:80%的财富集中在20%的人手中, 80%的用户只使用20%的功能 , 20%的用户贡献了80%的访问量. 俗话是,一 ...

  6. DevExpress XtraReport - 动态加载报表布局模板

    XtraReport的报表模板文件是.repx,下面的代码演示动态加载报表布局模板. XtraReport mReport = new XtraReport(); mReport.LoadLayout ...

  7. Spring生态圈的概要说明

    Spring生态圈的概要说明   以下摘抄自<Spring Boot实战>一书某章节. ================================= Spring 主要jar包 (1 ...

  8. 华为交换机trunk端口更改access提示:Error: Please renew the default configurations.

    现象: 华为交换机接口由原来 trunk 接口更改 access 提示 Error: Please renew the default configurations. 解决方法: 在交换机视图模式下, ...

  9. 五、Spring中的@Import注解

    一.使用@Import注解导入组件 @Import注解的作用是给容器中导入组件,回顾下我们给容器中导入组件的方式,可以通过Spring的xm配置方式,可以通过注解,如@Component等,也可以通过 ...

  10. Appium 环境配置(sdk)

    1,jdk环境配置 参见jdk环境配置:https://www.cnblogs.com/changpuyi/p/8659545.html 2,sdk环境的配置 前提已经下载,解压adt-bundle- ...