pandas分组统计：groupby，melt，pivot

groupby: 分组

melt: 宽表转长表

pivot_table: 长表转宽表，数据透视表

crosstab: 交叉表 / 列联表，主要用于分组频数统计

import numpy as np

import pandas as pd

df = pd.DataFrame({'key1':['a','a','b','b','a'],

                   'key2':['one','two','one','two','one'],

                   'data1':np.random.randn(5),

                   'data2':np.random.randn(5)

                   })

#  key1 key2     data1     data2

#0    a  one  0.498857  0.074495

#1    a  two  2.872086 -1.303973

#2    b  one -0.721171 -1.315390

#3    b  two  0.985844  0.419780

#4    a  one -0.134534 -0.732861

# ####################

'''groupby 用法'''

group1 = df.groupby('key1')

group2 = df.groupby(['key1','key2'])

[x for x in group1]

group1.size()

group1.sum()

group2.count()

group1['data1','data2'].agg(['mean','sum'])  #作用于所有列

group2(['key1','key2']).apply(lambda x: pd.Series([x.shape[0], x['key1'].mean(), x['key2'].sum()],

       index=['counts', 'key1_mean', 'key2_sum']))  #作用于指定列

# ####################

''' melt 用法 -- 宽表转长表 '''

pd.melt(df, id_vars=['key1', 'key2'], value_vars=['data1', 'data2'], var_name='var', value_name='value')  #col_level

#  key1 key2    var     value

#0    a  one  data1  0.498857

#1    a  two  data1  2.872086

#2    b  one  data1 -0.721171

#3    b  two  data1  0.985844

#4    a  one  data1 -0.134534

#5    a  one  data2  0.074495

#6    a  two  data2 -1.303973

#7    b  one  data2 -1.315390

#8    b  two  data2  0.419780

#9    a  one  data2 -0.732861

# ####################

''' crosstab 用法 -- 列联表（count） '''

pd.crosstab(df.key1, df.key2, margins=True)

#key2  one  two  All

#key1

#a       2    1    3

#b       1    1    2

#All     3    2    5

# ####################

''' pivot_table 用法 -- 长表转宽表 '''

# pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None,

# 　　　　　　　　dropna=True, margins=False, margins_name='ALL')  #aggfunc={'d':np.sum, 'e':np.max}

pd.pivot_table(df, index='key1', columns='key2')

#         data1               data2

#key2       one       two       one       two

#key1

#a     0.182162  2.872086 -0.329183 -1.303973

#b    -0.721171  0.985844 -1.315390  0.419780

df.pivot_table(['data1'], index='key1', columns='key2', fill_value=0)  #['data1']

#         data1

#key2       one       two

#key1

#a     0.182162  2.872086

#b    -0.721171  0.985844

参考链接：

Pandas：透视表(pivotTab)和交叉表(crossTab)

pandas模块，Melt函数

Pandas分组统计函数：groupby、pivot_table及crosstab

pandas分组统计：groupby，melt，pivot_table，crosstab的用法的更多相关文章

Pandas分组（GroupBy）
任何分组(groupby)操作都涉及原始对象的以下操作之一.它们是 - 分割对象应用一个函数结合的结果在许多情况下,我们将数据分成多个集合,并在每个子集上应用一些函数.在应用函数中,可以执行以下 ...
pandas 分组统计
# coding:utf-8 import pandas as pd import numpy as np # path = r'C:\Users\wuzaipei\Desktop\桂林三金项目签到情 ...
Pandas分组统计函数：groupby、pivot_table及crosstab
利用python的pandas库进行数据分组分析十分便捷,其中应用最多的方法包括:groupby.pivot_table及crosstab,以下分别进行介绍. 0.样例数据 df = DataFram ...
Pandas分组运算（groupby）修炼
Pandas分组运算(groupby)修炼 Pandas的groupby()功能很强大,用好了可以方便的解决很多问题,在数据处理以及日常工作中经常能施展拳脚. 今天,我们一起来领略下groupby() ...
pandas聚合和分组运算——GroupBy技术(1)
数据聚合与分组运算——GroupBy技术(1),有需要的朋友可以参考下. pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片.切块.摘要等操作.根据一个或多个 ...
pandas处理csv，分组统计
需求: /tmp/demo/data下有10个csv文件,按col0和col1分组分别统计col2和col3总和并计算col2和col3的商 # encoding:utf-8 import panda ...
DataTable、List使用groupby进行分组和分组统计；List、DataTable查询筛选方法
DataTable分组统计: .用两层循环计算,前提条件是数据已经按分组的列排好序的. DataTable dt = new DataTable(); dt.Columns.AddRange(new ...
C# Linq及Lamda表达式实战应用之 GroupBy 分组统计
在项目中做统计图表的时候,需要对查询出来的列表数据进行分组统计,首先想到的是避免频繁去操作数据库可以使用 Linq eg: //例如对列表中的Cu元素进行按年GroupBy分组统计 //包含年份,平均 ...
Python Pandas分组聚合
Pycharm 鼠标移动到函数上,CTRL+Q可以快速查看文档,CTR+P可以看基本的参数. apply(),applymap()和map() apply()和applymap()是DataFrame ...

随机推荐

两个list合并成一个list的操作
addAll 添加另一集合里面的元素 add 添加整个集合包括 [] Stream 操作合并两个lis 出自http://www.it1352.com/963663.html public cl ...
[配置]VUE中通过process.env判断开发，测试和生产环境，并分环境配置不同的URL HOST
本文链接:https://blog.csdn.net/tom_wong666/article/details/89763620 Tom哥的博客博文分类和索引页面地址:https://blog.csdn ...
nginx学习(五)：nginx.conf 核心配置文件详解
整体结构详细信息 1.设置worker进程的用户,指的linux中的用户,会涉及到nginx操作目录或文件的一些权限,默认为nobody user root; 2.worker进程工作数设置,一般来 ...
WPF 后台获得数据模板里的内容控件（DataTemplate）
原文:WPF 后台获得数据模板里的内容控件(DataTemplate) 假如 <Window.Resources> 里有一个 Datatemplate 我想获得TextBlo ...
Vue 修饰符once的方法使用
once:只执行一次代码: <!doctype html> <html lang="en"> <head> <meta charset= ...
MYSQL ERROR:1130 解决
MYSQL ERROR:1130 解决 ERROR 1130: Host '127.0.0.7' is not allowed to connect to this MySQL server 解决 ...
DevExpress中TreeList树样式调整
DevExpress的TreeList默认是没有树状线的,修改TreeLineStyle属性无效,这对于Tree并不好看. 解决方案一官方解释说对于DevExpress的标准主题是不支持TreeLi ...
一文学会 TypeScript 的 82% 常用知识点（下）
一文学会 TypeScript 的 82% 常用知识点(下) 前端专栏 2019-11-23 18:39:08 都已经 9021 年了,TypeScript(以下简称 TS)作为前端工程师不得 ...
workbook数据相关操作
访问单个单元格 c = ws['A4'] #返回单元格A4,如果单元格不存在,则会自动创建 ws['A4'] = 4 #为单元格A4赋值为4 d = ws.cell(row=4, column=2, ...
IT兄弟连 HTML5教程 HTML5的基本语法简单HTML实例制作
现在学习HTML5的方式目前HTML还处于HTML4与HTML5之间的过渡使用阶段.移动端的Web界面开发已经全面使用HTML5的技术,而在PC端由于用户升级浏览器周期较长,面临着页面的兼容性问题, ...

pandas分组统计：groupby，melt，pivot_table，crosstab的用法

pandas分组统计：groupby，melt，pivot_table，crosstab的用法的更多相关文章

随机推荐

热门专题