pandas_使用透视表与交叉表查看业绩汇总数据

# 使用透视表与交叉表查看业绩汇总数据

import pandas as pd

import numpy as np

import copy

# 设置列对齐

pd.set_option("display.unicode.ambiguous_as_wide",True)

pd.set_option("display.unicode.east_asian_width",True)

dataframe = pd.read_excel(r'C:\Users\lenovo\Desktop\总结\Python\超市营业额.xlsx')

# 对姓名和日期进行分组,并进行求和

dff = dataframe.groupby(by = ['姓名','日期'],as_index = False).sum()

'''

    姓名      日期  工号  交易额

0   周七  20190301  1005     600

1   周七  20190302  1005     580

2   张三  20190301  1001    2000

3   张三  20190302  2002    1900

4   张三  20190303  1001    1300

5   李四  20190301  1002    1800

6   李四  20190302  2004    2180

7   王五  20190301  1003     800

8   王五  20190302  2006    1830

9   赵六  20190301  1004    1100

10  赵六  20190302  1004    1050

11  钱八  20190301  2012    1550

12  钱八  20190302  1006     720

'''

# 将 dff 的索引，列 设置成透视表形式

dff = dff.pivot(index = '姓名',columns = '日期',values = '交易额')

'''

日期  20190301  20190302  20190303

姓名

周七     600.0     580.0       NaN

张三    2000.0    1900.0    1300.0

李四    1800.0    2180.0       NaN

王五     800.0    1830.0       NaN

赵六    1100.0    1050.0       NaN

钱八    1550.0     720.0       NaN

'''

# 查看前一天的数据

dff.iloc[:,:1]

'''

日期  20190301

姓名

周七     600.0

张三    2000.0

李四    1800.0

王五     800.0

赵六    1100.0

钱八    1550.0

'''

# 交易总额小于 4000 的人的前三天业绩

dff[dff.sum(axis = 1) < 4000].iloc[:,:3]

'''

日期  20190301  20190302  20190303

姓名

周七     600.0     580.0       NaN

李四    1800.0    2180.0       NaN

王五     800.0    1830.0       NaN

赵六    1100.0    1050.0       NaN

钱八    1550.0     720.0       NaN

'''

# 工资总额大于 2900 元的员工的姓名

dff[dff.sum(axis = 1) > 2900].index.values

# array(['张三', '李四'], dtype=object)

# 显示前两天每一天的交易总额以及每个人的交易金额

dataframe.pivot_table(values = '交易额',index = '姓名',

                      columns = '日期',aggfunc = 'sum',margins = True).iloc[:,:2]

'''

日期  20190301  20190302

姓名

周七     600.0     580.0

张三    2000.0    1900.0

李四    1800.0    2180.0

王五     800.0    1830.0

赵六    1100.0    1050.0

钱八    1550.0     720.0

All     7850.0    8260.0

'''

# 显示每个人在每个柜台的交易总额

dff = dataframe.groupby(by = ['姓名','柜台'],as_index = False).sum()

dff.pivot(index = '姓名',columns = '柜台',values = '交易额')

'''

柜台  化妆品  日用品  蔬菜水果    食品

姓名

周七     NaN  1180.0       NaN     NaN

张三  4600.0     NaN     600.0     NaN

李四  3300.0     NaN     680.0     NaN

王五     NaN     NaN     830.0  1800.0

赵六     NaN     NaN       NaN  2150.0

钱八     NaN  1420.0     850.0     NaN

'''

# 查看每人每天的上班次数

dataframe.pivot_table(values = '交易额',index = '姓名',columns = '日期',aggfunc = 'count',margins = True).iloc[:,:1]

'''

日期  20190301

姓名

周七       1.0

张三       1.0

李四       1.0

王五       1.0

赵六       1.0

钱八       2.0

All        7.0

'''

# 查看每个人每天购买的次数

dataframe.pivot_table(values = '交易额',index = '姓名',columns = '日期',aggfunc = 'count',margins = True)

'''

日期  20190301  20190302  20190303  All

姓名

周七       1.0       1.0       NaN    2

张三       1.0       2.0       1.0    4

李四       1.0       2.0       NaN    3

王五       1.0       2.0       NaN    3

赵六       1.0       1.0       NaN    2

钱八       2.0       1.0       NaN    3

All        7.0       9.0       1.0   17

'''

# 交叉表

# 每个人每天上过几次班

pd.crosstab(dataframe.姓名,dataframe.日期,margins = True).iloc[:,:2]

'''

日期  20190301  20190302

姓名

周七         1         1

张三         1         2

李四         1         2

王五         1         2

赵六         1         1

钱八         2         1

All          7         9

'''

# 每个人每天去过几次柜台

pd.crosstab(dataframe.姓名,dataframe.柜台)

'''

柜台  化妆品  日用品  蔬菜水果  食品

姓名

周七       0       2         0     0

张三       3       0         1     0

李四       2       0         1     0

王五       0       0         1     2

赵六       0       0         0     2

钱八       0       2         1     0

'''

# 将每一个人在每一个柜台的交易总额显示出来

pd.crosstab(dataframe.姓名,dataframe.柜台,dataframe.交易额,aggfunc='sum')

'''

柜台  化妆品  日用品  蔬菜水果    食品

姓名

周七     NaN  1180.0       NaN     NaN

张三  4600.0     NaN     600.0     NaN

李四  3300.0     NaN     680.0     NaN

王五     NaN     NaN     830.0  1800.0

赵六     NaN     NaN       NaN  2150.0

钱八     NaN  1420.0     850.0     NaN

'''

# 每个人在每个柜台交易额的平均值,金额/天数

pd.crosstab(dataframe.姓名,dataframe.柜台,dataframe.交易额,aggfunc = 'mean').apply(lambda  num:round(num,2) )

'''

柜台   化妆品  日用品  蔬菜水果    食品

姓名

周七      NaN   590.0       NaN     NaN

张三  1533.33     NaN     600.0     NaN

李四  1650.00     NaN     680.0     NaN

王五      NaN     NaN     830.0   900.0

赵六      NaN     NaN       NaN  1075.0

钱八      NaN   710.0     850.0     NaN

'''

2020-05-07

pandas_使用透视表与交叉表查看业绩汇总数据的更多相关文章

Pandas透视表和交叉表
透视表参数名说明 values 待聚合的列的名称.默认聚合所有数值列 index 用于分组的列名或其他分组键,出现在结果透视表的行 columns 用于分组的列表或其他分组键,出现在结果透视表的列 ...
2018.03.29 python-pandas 数据透视pivot table / 交叉表crosstab
#透视表 pivot table #pd.pivot_table(data,values=None,index=None,columns=None, import numpy as np import ...
【每日一学】pandas_透视表函数&交叉表函数
每日一悟 [分开工作内外8小时] 前一个月,我经常把工作内的问题带到路上.地铁上.睡觉前,甚至是周末. 然而很快发现,我工作外的成就几乎没有,而工作内的进展也并不理想. 仔细想想,工作外是需要学新东西 ...
FastReport的交叉表实际使用的一个例子
计算发行-->定义份数月表(打开)出现 PosFraisPaysInput选择时间段后,点击“打印”.这个设计表格,就是交叉表. 交叉表的特点是:数据库是一条一条并列的但是出来的结果却是:横向是 ...
RS导出Excel交叉表角对应的列占用多列问题
在Cognos报表展示的时候,很多用户为了计算会把数据报表导出成excel然后再做统计,于是乎我做的一张报表导出成Excel的时候就出现了这样的问题从上图可以看出交叉表角对应的列 ‘一级手术’和‘二 ...
pandas交叉表和透视表及案例分析
一.交叉表: 作用: 交叉表是一种用于计算分组频率的特殊透视图,对数据进行汇总考察预测数据和正式数据的对比情况,一个作为行,一个作为列案例: 医院预测病人病情: 真实病情如下数组(B:有病,M:没 ...
pandas 之交叉表-透视表
import numpy as np import pandas as pd 认识 A pivot table is a data summarization tool(数据汇总工具) frequen ...
DevExpress XtraReports 入门五创建交叉表报表
原文:DevExpress XtraReports 入门五创建交叉表报表本文只是为了帮助初次接触或是需要DevExpress XtraReports报表的人群使用的,为了帮助更多的人不会像我这样浪 ...
Quick BI的宝藏工具——交叉表
对于普通的表格展示数据,相信大家都非常熟悉了,今天给大家介绍的是BI领域的分析利器-交叉表,这个在BI分析场景中使用占比最多的分析利器.通过交叉表对数据的承载和管理,用户可以一目了然地分析出各种场景指 ...

随机推荐

windows10 通过vnc远程访问ubuntu16.04
参考链接链接1 , 链接2 ,链接3 . 0.前言: 为方便深度学习训练,我们需要多个windows的电脑可以远程访问一个linux系统的工作站(以方便在linux系统上进行深度学习训练) 前提: ...
循环中的自变量-break和continue
1.break 作用:break 用于终止循环的执行, 过程:当执行到break语句后,程序将跳出循环,执行循环语句后边的代码 i=1 while i<10: if i==5: break pr ...
常用的rac搭建相关
平时自己测试环境搭建用,部分参数是不规范的. 生产请按照官方文档或者公司标准化文档来做. 共享硬盘: disk.locking = "FALSE" diskLib.dataCach ...
PHP实现邮箱验证码验证功能
*文章来源:https://blog.egsec.cn/archives/623 (我的主站) *本文将主要说明:PHP实现邮箱验证码验证功能,通过注册或登录向用户发送身份确认验证码,并通过判断输入 ...
JavaGUI练习 - 正交测试用例生成小工具
正交表生成小工具说明小工具的适用对象主要是测试人员,他们日常工作中手动设计大量测试用例,工作繁杂甚至还存在覆盖不全面等问题. 为了提高他们的测试效率,该小工具可以通过输入一组多因素多水平的数据,然 ...
使用Splunk监控SAP Dump
最近在尝试使用Splunk对SAP系统进行监控,以Dump监控为例,总结了一点相关信息,记录在这里. 本文链接:https://www.cnblogs.com/hhelibeb/p/13260385. ...
C++输出三角图形
输出像这样的三角图形 3 1 1 1 1 1 1 1 1 1 1 1 1 ...
python 追踪函数调用
from flask import Flask import traceback app = Flask(__name__) @app.route('/') def hello_world(): tr ...
hls&flv直播请求过程
hls&flv直播请求过程直播类产品层出不穷,从各方面塑造了我们的生活方式.直播产品中,延时是决定用户体验的关键因素,它也将间接决定直播产品的成败.这其间,对延时影响较大的就是直播架构中选择 ...
js 自定义阻止事件冒泡函数
// 以下改方法全兼容Chrome function stopBubble(event){ if(event.stopPropagation){ // 兼容火狐(firebox) event.st ...

pandas_使用透视表与交叉表查看业绩汇总数据

pandas_使用透视表与交叉表查看业绩汇总数据的更多相关文章

随机推荐

热门专题