pandas-04 多级index操作

在pandas中可以为series和dataframe设置多个index，也就是说可以有多级index和column。这样可以对pandas的操作更加灵活。

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

np.random.seed(666)

# series 中的 index

s1 = Series(np.random.randn(6), index=[['1', '1', '1', '2', '2', '2'], ['a', 'b', 'c', 'a', 'b', 'c']])

print(s1)

'''

1  a    0.824188

   b    0.479966

   c    1.173468

2  a    0.909048

   b   -0.571721

   c   -0.109497

dtype: float64

'''

print(s1['1']) # 可以 获取 index 为 1 的 series

'''

a    0.824188

b    0.479966

c    1.173468

dtype: float64

'''

print(s1['1']['a']) # 0.8241880833175302

print(s1[:, 'a'])

''' 同样是一个 series

1    0.824188

2    0.909048

dtype: float64

'''

# 多级的Series， 可以转化为一个 dataframe

df1 = s1.unstack() # 二级series 可以转化dataframe

print(df1)

'''

          a         b         c

1  0.824188  0.479966  1.173468

2  0.909048 -0.571721 -0.109497

'''

df2 = DataFrame([s1['1'], s1['2']])

print(df2)

'''

          a         b         c

0  0.824188  0.479966  1.173468

1  0.909048 -0.571721 -0.109497

'''

# dataframe 转化为 series

s2 = df1.unstack()

print(s2)

'''

a  1    0.824188

   2    0.909048

b  1    0.479966

   2   -0.571721

c  1    1.173468

   2   -0.109497

dtype: float64

'''

s2 = df1.T.unstack()

print(s2)

'''

1  a    0.824188

   b    0.479966

   c    1.173468

2  a    0.909048

   b   -0.571721

   c   -0.109497

dtype: float64

'''

# 创建 一个 多级的 dataframe

df = DataFrame(np.arange(16).reshape(4, 4), index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]], \

               columns=[['beijing', 'beijing', 'shanghai', 'shanghai'], [8, 9, 8, 9]]

               )

print(df)

'''

    beijing     shanghai

          8   9        8   9

a 1       0   1        2   3

  2       4   5        6   7

b 1       8   9       10  11

  2      12  13       14  15

'''

# 访问 多级 dataframe 的元素

print(df['beijing']) # 返回 也是一个 dataframe

'''

      8   9

a 1   0   1

  2   4   5

b 1   8   9

  2  12  13

'''

print(df['beijing'][8]) # 访问dataframe和访问Series的方法一样

'''

a  1     0

   2     4

b  1     8

   2    12

Name: 8, dtype: int64

'''

pandas-04 多级index操作的更多相关文章

利用SolrJ操作solr API完成index操作
使用SolrJ操作Solr会比利用httpClient来操作Solr要简单.SolrJ是封装了httpClient方法,来操作solr的API的.SolrJ底层还是通过使用httpClient中的方法 ...
ES6.3.2 index操作源码流程
ES 6.3.2 index 操作源码流程 client 发送请求 TransportBulkAction#doExecute(Task,BulkRequest,listener) 解析请求,是否要自 ...
ElasticSearch Index操作源码分析
ElasticSearch Index操作源码分析本文记录ElasticSearch创建索引执行源码流程.从执行流程角度看一下创建索引会涉及到哪些服务(比如AllocationService.Mas ...
python. pandas(series,dataframe,index) method test
python. pandas(series,dataframe,index,reindex,csv file read and write) method test import pandas as ...
pandas数据结构之DataFrame操作
这一次我的学习笔记就不直接用官方文档的形式来写了了,而是写成类似于“知识图谱”的形式,以供日后参考. 下面是所谓“知识图谱”,有什么用呢? 1.知道有什么操作(英文可以不看) 2.展示本篇笔记的结构 ...
pandas数据结构之series操作
阅读之前假定你已经有了python内置的list和dict的基础.这里内容几乎是官方文档的翻译版本. 概览: 原来的文档是在一个地方,那边的代码看起来舒服些 https://www.y ...
pandas（一）操作Series和DataFrame的基本功能
reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象以Series为例 >>> series_obj = Series([4. ...
Pandas | 04 Panel 面板
面板(Panel)是3D容器的数据.面板数据一词来源于计量经济学,部分源于名称:Pandas - pan(el)-da(ta)-s. 3轴(axis)这个名称旨在给出描述涉及面板数据的操作的一些语义. ...
Pandas 之 DataFrame 常用操作
import numpy as np import pandas as pd This section will walk you(引导你) through the fundamental(基本的) ...

随机推荐

Git Bash设置代理
从GitHub clone代码速度比较慢,设置代理,(假设端口是1080): git config --global https.proxy http://127.0.0.1:1080 git con ...
Metasploit使用内网跳板，扫描局域网主机
最近,拿到一台内网机器, 苦于无法使用nmap扫描改主机的内网, 所以才有此文在跳板机子获取一定权限后,需要积极的向内网主机权限发展,获取指定的目标信息,探查系统漏洞,借助msf已经得到的meter ...
intellij idea远程调试
有时候发布后的包不得不进行debug,但是又不方便本地开发环境直接debug模拟,所以不得不需要远程debug. 启动参数首先在服务端使用JVM的-Xdebug参数启动Jar包. java -Xde ...
arcpy地理处理工具案例教程-将细碎图斑按相同属性或相近属性合并相邻图斑
arcpy地理处理工具案例教程-将细碎图斑按相同属性或相近属性合并到相邻图斑商务合作,科技咨询,版权转让:向日葵,135-4855_4328,xiexiaokui#qq.com 目的:针对存在的细碎 ...
Default Activity Not Found解决方法
2018年04月07日 17:22:44 Luckily_Liu 阅读数 13573更多分类专栏: android 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上 ...
java合并多个word 2007 文档基于docx4j
参考文章:http://dh.swzhinan.com/post/185.html 引入的jar包 <dependency> <groupId>org.docx4j</g ...
vue form表单上传文件
<script src="https://cdn.staticfile.org/vue-resource/1.5.1/vue-resource.min.js">< ...
linux查看占用内存前10的命令
kotlin基础 range
a = 1..10 //[1,10] b = 1 unitl 10 //[1,10)
IIS服务器怎么查看网站日志
在做网站的优化以及网站安全的时候,分析网站的日志是非常重要的,但是公司的服务器是IIS的,以前弄的是linux的服务器,不知道该怎么弄,最终找到了解决办法. 1.iis默认是有日志的,在iislog下 ...

pandas-04 多级index操作

pandas-04 多级index操作

pandas-04 多级index操作的更多相关文章

随机推荐

热门专题