Pandas重塑和轴向旋转

重塑和轴向旋转

Se

import pandas as pd

import numpy as np

from pandas import Series

data=pd.DataFrame(np.arange(6).reshape(2,3),

                  index=['Ohio','Colorado'],

                  columns=['one','two','three']

                 )

data.index.names=['state']

data.columns.names=['number']

data

number	   one	two	three

   state

   Ohio	    0	1	2

Colorado	3	4	5

# 使用该unstack()方法可将列转为行，一一对应，得到一个Series

result = data.stack()

result

state     number

Ohio      one       0

          two       1

          three     2

Colorado  one       3

          two       4

          three     5

dtype: int32

# unstack()可以将其重排为一个DataFrame

result.unstack()

number	one	two	three

   state

   Ohio	    0	1	2

Colorado	3	4	5

# 默认情况下，unstack操作的是最里面的那层number,这个对象可以接收索引的编号啊或名称

result.unstack('state')

state	  Ohio Colorado

number

  one	    0	3

  two	    1	4

  three	    2	5

# 传入索引名称，都是讲state的层次化索引变为DataFrame格式

result.unstack(0)

state	   Ohio	Colorado

number

 one	    0	3

 two	    1	4

 three	    2	5

 # 当组里的值不是都有的时候，unstack会引入缺失数

s1 = Series([0,1,2,3],index=['a','b','c','d'])

s2 = Series([4,5,6], index=['c','d','e'])

data2 = pd.concat([s1,s2],keys=['one','two'])

data2

one  a    0

     b    1

     c    2

     d    3

two  c    4

     d    5

     e    6

dtype: int64

data2.unstack()

    a	b	c	d	e

one	0.0	1.0	2.0	3.0	NaN

two	NaN	NaN	4.0	5.0	6.0

# 但是stack却可以过滤掉缺失数据,如果不想过滤，可以dropna=False

data2.unstack().stack()

one  a    0.0

     b    1.0

     c    2.0

     d    3.0

two  c    4.0

     d    5.0

     e    6.0

dtype: float64

# 这是不过滤的效果

data2.unstack().stack(dropna=False)

one  a    0.0

     b    1.0

     c    2.0

     d    3.0

     e    NaN

two  a    NaN

     b    NaN

     c    4.0

     d    5.0

     e    6.0

dtype: float64

# DataFrame中的stack和unstack

result

state     number

Ohio      one       0

          two       1

          three     2

Colorado  one       3

          two       4

          three     5

dtype: int32

df = pd.DataFrame({'left':result, 'right':result+5},columns=pd.Index(['left','right'],name='side'))

df

          side	   left	   right

state	  number

Ohio	  one	     0	      5

          two	     1	      6

          three	     2	      7

Colorado  one	     3	      8

          two	     4	      9

          three	     5	      10

# 对DataFrame进行unstack操作，会将旋转轴变为结果中的最低级别,变为层次化索引的最低级别

df.unstack('state')

side	left	            right

state	Ohio	Colorado	Ohio	Colorado

number

one	     0	  3	               5	  8

two	     1	  4	               6	  9

three	 2	  5	               7	  10

# side也会是最低级别，把side折叠

df.unstack('state').stack('side')

state	       Colorado	Ohio

number	side

one	    left	3	      0

        right	8	      5

two	    left	4	      1

        right	9	      6

three	left	5	      2

        right	10	      7

时间序列数据的堆叠格式

data_c = [

    ['1959-03-31','realgdb',2710.349],

    ['1959-03-31','infl',0.000],

    ['1959-03-31','unemp',5.800],

    ['1959-06-30','realgdb',2778.801],

    ['1959-06-30','infl',2.340],

    ['1959-06-30','unemp',5.100],

    ['1959-09-30','realgdb',2775.488],

    ['1959-09-30','infl',2.740],

    ['1959-09-30','unemp',5.300],

]

ldata = pd.DataFrame(data_c,columns=['data','item','value'])

ldata

        data	item	value

0	1959-03-31	realgdb	2710.349

1	1959-03-31	infl	0.000

2	1959-03-31	unemp	5.800

3	1959-06-30	realgdb	2778.801

4	1959-06-30	infl	2.340

5	1959-06-30	unemp	5.100

6	1959-09-30	realgdb	2775.488

7	1959-09-30	infl	2.740

8	1959-09-30	unemp	5.300

# 将data作为行索引，item作为列索引,最简单的方法,pivot快捷函数

ldata.pivot('data','item','value')

item	    infl	realgdb	    unemp

      data

1959-03-31	0.00	2710.349	5.8

1959-06-30	2.34	2778.801	5.1

1959-09-30	2.74	2775.488	5.3

# pivot其实是执行了如下两步,本质还是堆叠

#第一步

ldata.set_index(['data','item'])

	                value

    data	item

1959-03-31	realgdb	2710.349

            infl	0.000

            unemp	5.800

1959-06-30	realgdb	2778.801

            infl	2.340

            unemp	5.100

1959-09-30	realgdb	2775.488

            infl	2.740

            unemp	5.300

# 第二步

ldata.set_index(['data','item']).unstack()

value

item	    infl	realgdb	   unemp

   data

1959-03-31	0.00	2710.349	5.8

1959-06-30	2.34	2778.801	5.1

1959-09-30	2.74	2775.488	5.3

Pandas重塑和轴向旋转的更多相关文章

pandas学习(创建多层索引、数据重塑与轴向旋转)
pandas学习(创建多层索引.数据重塑与轴向旋转) 目录创建多层索引数据重塑与轴向旋转创建多层索引隐式构造 Series 最常见的方法是给DataFrame构造函数的index参数传递两个或 ...
pandas(八)重塑和轴向旋转
重塑层次化索引层次化索引为DataFrame的重排提供了良好的一致性操作,主要方法有 stack :将数据的列旋转为行 unstack:将数据的行转换为列用一个dataframe对象举例 In [ ...
利用Python进行数据分析(13) pandas基础: 数据重塑/轴向旋转
重塑定义重塑指的是将数据重新排列,也叫轴向旋转. DataFrame提供了两个方法: stack: 将数据的列“旋转”为行. unstack:将数据的行“旋转”为列. 例如: 处理堆叠格式 ...
WPF动画旋转（3轴同时旋转问题）
原文:WPF动画旋转(3轴同时旋转问题) WPF的资料比较少,做起来不是很方便,之前一直有个XYZ3个轴同时旋转的问题,开始的时候以为通过 this.theRotateX.Axis = new Ve ...
【OSG细节实现】节点围绕位于axisPos平行于axis的轴进行旋转
//绕着与axis平行的任意轴旋转 void rotate(const std::string& name, float angle, osg::Vec3 axisPos, osg::Vec3 ...
Python Pandas 时间序列双轴折线图
时间序列pv-gmv双轴折线图 import numpy as np import pandas as pd import matplotlib.pyplot as plt n = 12 date_s ...
pandas DataFrame(3)-轴
和numpy数组(5)-二维数组的轴一样,pandas DataFrame也有轴的概念,决定了方法是对行应用还是对列应用: 以下面这个数据为例说明: 这个数据是5个车站10天内的客流数据: rider ...
CSS3.0动画之hover---Y轴----3D旋转
div#div2{display: table; width: 100%; height: 100%; text-decoration: none; outline: none; -webkit-tr ...
【学习】数据规整化：清理、转换、合并、重塑（续）【pandas】
@合并重叠数据还有一种数据组合问题不能用简单的合并或连接运算来处理.比如说,你可能有索引全部或部分重叠的两个数据集使用numpy的where函数,它用于表达一种矢量化的if - else a = ...

随机推荐

hdu 1754 I Hate It (单点修改+区间最值+裸题)
Time Limit: 9000/3000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submission(s) ...
BIOS（Basic Input/Output System）是基本输入输出系统的简称
BIOS(Basic Input/Output System)是基本输入输出系统的简称介绍操作系统老师说,平时面试学生或者毕业答辩的时候他都会问这个问题,可见这个问题对于计算机专业的学生来说是如此 ...
WIdo联网代码中文注释
代码如下 /*************************************************** 这是一个例子的dfrobot维多-无线集成物联网建兴传感器和控制节点 *产品页面及更 ...
struct 和typedef struct
1.typedef (1)typedef的使用定义一种类型的别名,而不只是简单的宏替换(见陷阱一).用作同时声明指针型的多个对象 typedef char* PCHAR; // 一般用大写,为cha ...
kali 2018.2版本运行破解版burpsuite时候的问题。
最近重装了kali虚拟机,装完之后把burp拷到里面发现运行不了了,折腾了下才解决,问题主要是由于java环境造成的. 系统默认是以java10运行burp的,但是java10好像是不支持 -X ...
js中常用的内置对象
Arguments 函数参数集合 arguments[ ] 函数参数的数组 Arguments 一个函数的参数和其他属性 Arguments.callee 当前正在运行的函数 Argument ...
Java_初入IO流_字符流_Write-Read_小笔记
package IO; import java.io.FileWriter; import java.io.IOException; class File_Writer { public static ...
Centos7 下的SVN安装与配置
Centos7 下的SVN安装与配置 1.关闭防火墙临时关闭防火墙 systemctl stop firewalld 永久防火墙开机自关闭 systemctl disable firewalld 临 ...
【java】static的应用场景
定义静态原则: 什么时候定义静态变量:对象中出现共享数据时,该数据被static所修饰.如国家什么时候定义静态方法:当功能内部没有访问到非静态数据时,该方法可以定义成静态的工具类的例子: /** ...
8、sort排序中比较函数的几种应用方式
1.待排序中的元素作数组的下标或map的键值例题:PAT甲级_1141 PAT Ranking of Institutions #include<bits/stdc++.h> using ...

Pandas重塑和轴向旋转

重塑和轴向旋转

Se

时间序列数据的堆叠格式

Pandas重塑和轴向旋转的更多相关文章

随机推荐

热门专题