pandas_使用透视表与交叉表查看业绩汇总数据

# 使用透视表与交叉表查看业绩汇总数据

import pandas as pd

import numpy as np

import copy

# 设置列对齐

pd.set_option("display.unicode.ambiguous_as_wide",True)

pd.set_option("display.unicode.east_asian_width",True)

dataframe = pd.read_excel(r'C:\Users\lenovo\Desktop\总结\Python\超市营业额.xlsx')

# 对姓名和日期进行分组,并进行求和

dff = dataframe.groupby(by = ['姓名','日期'],as_index = False).sum()

'''

    姓名      日期  工号  交易额

0   周七  20190301  1005     600

1   周七  20190302  1005     580

2   张三  20190301  1001    2000

3   张三  20190302  2002    1900

4   张三  20190303  1001    1300

5   李四  20190301  1002    1800

6   李四  20190302  2004    2180

7   王五  20190301  1003     800

8   王五  20190302  2006    1830

9   赵六  20190301  1004    1100

10  赵六  20190302  1004    1050

11  钱八  20190301  2012    1550

12  钱八  20190302  1006     720

'''

# 将 dff 的索引，列 设置成透视表形式

dff = dff.pivot(index = '姓名',columns = '日期',values = '交易额')

'''

日期  20190301  20190302  20190303

姓名

周七     600.0     580.0       NaN

张三    2000.0    1900.0    1300.0

李四    1800.0    2180.0       NaN

王五     800.0    1830.0       NaN

赵六    1100.0    1050.0       NaN

钱八    1550.0     720.0       NaN

'''

# 查看前一天的数据

dff.iloc[:,:1]

'''

日期  20190301

姓名

周七     600.0

张三    2000.0

李四    1800.0

王五     800.0

赵六    1100.0

钱八    1550.0

'''

# 交易总额小于 4000 的人的前三天业绩

dff[dff.sum(axis = 1) < 4000].iloc[:,:3]

'''

日期  20190301  20190302  20190303

姓名

周七     600.0     580.0       NaN

李四    1800.0    2180.0       NaN

王五     800.0    1830.0       NaN

赵六    1100.0    1050.0       NaN

钱八    1550.0     720.0       NaN

'''

# 工资总额大于 2900 元的员工的姓名

dff[dff.sum(axis = 1) > 2900].index.values

# array(['张三', '李四'], dtype=object)

# 显示前两天每一天的交易总额以及每个人的交易金额

dataframe.pivot_table(values = '交易额',index = '姓名',

                      columns = '日期',aggfunc = 'sum',margins = True).iloc[:,:2]

'''

日期  20190301  20190302

姓名

周七     600.0     580.0

张三    2000.0    1900.0

李四    1800.0    2180.0

王五     800.0    1830.0

赵六    1100.0    1050.0

钱八    1550.0     720.0

All     7850.0    8260.0

'''

# 显示每个人在每个柜台的交易总额

dff = dataframe.groupby(by = ['姓名','柜台'],as_index = False).sum()

dff.pivot(index = '姓名',columns = '柜台',values = '交易额')

'''

柜台  化妆品  日用品  蔬菜水果    食品

姓名

周七     NaN  1180.0       NaN     NaN

张三  4600.0     NaN     600.0     NaN

李四  3300.0     NaN     680.0     NaN

王五     NaN     NaN     830.0  1800.0

赵六     NaN     NaN       NaN  2150.0

钱八     NaN  1420.0     850.0     NaN

'''

# 查看每人每天的上班次数

dataframe.pivot_table(values = '交易额',index = '姓名',columns = '日期',aggfunc = 'count',margins = True).iloc[:,:1]

'''

日期  20190301

姓名

周七       1.0

张三       1.0

李四       1.0

王五       1.0

赵六       1.0

钱八       2.0

All        7.0

'''

# 查看每个人每天购买的次数

dataframe.pivot_table(values = '交易额',index = '姓名',columns = '日期',aggfunc = 'count',margins = True)

'''

日期  20190301  20190302  20190303  All

姓名

周七       1.0       1.0       NaN    2

张三       1.0       2.0       1.0    4

李四       1.0       2.0       NaN    3

王五       1.0       2.0       NaN    3

赵六       1.0       1.0       NaN    2

钱八       2.0       1.0       NaN    3

All        7.0       9.0       1.0   17

'''

# 交叉表

# 每个人每天上过几次班

pd.crosstab(dataframe.姓名,dataframe.日期,margins = True).iloc[:,:2]

'''

日期  20190301  20190302

姓名

周七         1         1

张三         1         2

李四         1         2

王五         1         2

赵六         1         1

钱八         2         1

All          7         9

'''

# 每个人每天去过几次柜台

pd.crosstab(dataframe.姓名,dataframe.柜台)

'''

柜台  化妆品  日用品  蔬菜水果  食品

姓名

周七       0       2         0     0

张三       3       0         1     0

李四       2       0         1     0

王五       0       0         1     2

赵六       0       0         0     2

钱八       0       2         1     0

'''

# 将每一个人在每一个柜台的交易总额显示出来

pd.crosstab(dataframe.姓名,dataframe.柜台,dataframe.交易额,aggfunc='sum')

'''

柜台  化妆品  日用品  蔬菜水果    食品

姓名

周七     NaN  1180.0       NaN     NaN

张三  4600.0     NaN     600.0     NaN

李四  3300.0     NaN     680.0     NaN

王五     NaN     NaN     830.0  1800.0

赵六     NaN     NaN       NaN  2150.0

钱八     NaN  1420.0     850.0     NaN

'''

# 每个人在每个柜台交易额的平均值,金额/天数

pd.crosstab(dataframe.姓名,dataframe.柜台,dataframe.交易额,aggfunc = 'mean').apply(lambda  num:round(num,2) )

'''

柜台   化妆品  日用品  蔬菜水果    食品

姓名

周七      NaN   590.0       NaN     NaN

张三  1533.33     NaN     600.0     NaN

李四  1650.00     NaN     680.0     NaN

王五      NaN     NaN     830.0   900.0

赵六      NaN     NaN       NaN  1075.0

钱八      NaN   710.0     850.0     NaN

'''

2020-05-07

pandas_使用透视表与交叉表查看业绩汇总数据的更多相关文章

Pandas透视表和交叉表
透视表参数名说明 values 待聚合的列的名称.默认聚合所有数值列 index 用于分组的列名或其他分组键,出现在结果透视表的行 columns 用于分组的列表或其他分组键,出现在结果透视表的列 ...
2018.03.29 python-pandas 数据透视pivot table / 交叉表crosstab
#透视表 pivot table #pd.pivot_table(data,values=None,index=None,columns=None, import numpy as np import ...
【每日一学】pandas_透视表函数&交叉表函数
每日一悟 [分开工作内外8小时] 前一个月,我经常把工作内的问题带到路上.地铁上.睡觉前,甚至是周末. 然而很快发现,我工作外的成就几乎没有,而工作内的进展也并不理想. 仔细想想,工作外是需要学新东西 ...
FastReport的交叉表实际使用的一个例子
计算发行-->定义份数月表(打开)出现 PosFraisPaysInput选择时间段后,点击“打印”.这个设计表格,就是交叉表. 交叉表的特点是:数据库是一条一条并列的但是出来的结果却是:横向是 ...
RS导出Excel交叉表角对应的列占用多列问题
在Cognos报表展示的时候,很多用户为了计算会把数据报表导出成excel然后再做统计,于是乎我做的一张报表导出成Excel的时候就出现了这样的问题从上图可以看出交叉表角对应的列 ‘一级手术’和‘二 ...
pandas交叉表和透视表及案例分析
一.交叉表: 作用: 交叉表是一种用于计算分组频率的特殊透视图,对数据进行汇总考察预测数据和正式数据的对比情况,一个作为行,一个作为列案例: 医院预测病人病情: 真实病情如下数组(B:有病,M:没 ...
pandas 之交叉表-透视表
import numpy as np import pandas as pd 认识 A pivot table is a data summarization tool(数据汇总工具) frequen ...
DevExpress XtraReports 入门五创建交叉表报表
原文:DevExpress XtraReports 入门五创建交叉表报表本文只是为了帮助初次接触或是需要DevExpress XtraReports报表的人群使用的,为了帮助更多的人不会像我这样浪 ...
Quick BI的宝藏工具——交叉表
对于普通的表格展示数据,相信大家都非常熟悉了,今天给大家介绍的是BI领域的分析利器-交叉表,这个在BI分析场景中使用占比最多的分析利器.通过交叉表对数据的承载和管理,用户可以一目了然地分析出各种场景指 ...

随机推荐

七月份开发语言排行榜，Java依然霸榜
day05数据绑定
流程:普通编辑-添加编辑模式 <text>数据绑定</text> <view>{{message}}</view> <button bindtap ...
Redis 6.0 访问控制列表ACL说明
背景在Redis6.0之前的版本中,登陆Redis Server只需要输入密码(前提配置了密码 requirepass )即可,不需要输入用户名,而且密码也是明文配置到配置文件中,安全性不高.并且应 ...
从上到下打印二叉树（剑指offer-22）
题目描述从上往下打印出二叉树的每个节点,同层节点从左至右打印. 题目解析使用队列来进行层次遍历,本质上就是宽搜. 题目解答 import java.util.*; /** public class ...
CSS3 实现复杂的背景图案
灵活的背景定位实现效果: 将背景图定位到距离容器底边 10px 且距离右边 20px 的位置. background-position 方案代码: <div>海盗密码</div& ...
List的isEmpty与==null的区别
集合的判空一般判定方法 ArrayList<Person> list = null; System.out.println(null == list);//return true Syst ...
浏览器如何解析css选择器？
浏览器会『从右往左』解析CSS选择器. 我们知道DOM Tree与Style Rules合成为 Render Tree,实际上是需要将Style Rules附着到DOM Tree上, 因此需要根据选择 ...
mysql 漏洞利用与提权
判断MySQL服务运行的权限 1.查看系统账号,如果出现MySQL这类用户,意味着系统可能出现了降权. 2.看mysqld运行的priority值. 3.查看端口是否可外联. MySQL密码获取与破解 ...
MYSQL 之 JDBC（四）：增删改查（二）通过ResultSet执行查询操作
/** * ResultSet:结果集.封装了使用JDBC进行查询的结果. * 1. 调用Statement对象的executeQuery(sql)方法 * 2. ResultSet返回的实际上就是一 ...
数据可视化之powerBI技巧（四）使用Power BI制作帕累托图
各种复杂现象的背后,其实都是受关键的少数因素和普通的大多数因素所影响,把主要精力放在关键的少数因素上,就能达到事半功倍的效果. 这就是大家常说的二八原则,也称为帕累托原则,最早是由意大利经济学家 V. ...

pandas_使用透视表与交叉表查看业绩汇总数据

pandas_使用透视表与交叉表查看业绩汇总数据的更多相关文章

随机推荐

热门专题