示例python 批量操作excel统计销售榜品牌及销售额

示例统计销售榜品牌及销售额

import pandas as pd

import numpy as np

import os

os.chdir('F:\\50mat\源数据1000张表格')

name = '户外服装&滑雪衣.xlsx'

df = pd.read_excel(name)

df.head()

打印结果

    日期	转化率	访客数	三级类目	客单价	品牌

0	2019-08	0.036466	837	滑雪衣	3887.646034	品牌-5

1	2019-08	0.006110	9951	滑雪衣	1890.920192	品牌-7

2	2019-08	0.008279	11067	滑雪衣	1001.541028	品牌-19

3	2019-08	0.003647	25296	滑雪衣	986.192182	品牌-17

4	2019-08	0.006012	5053	滑雪衣	2818.957816	品牌-14

df['日期'].unique()

打印结果

array(['2019-08', '2019-07', '2019-06', '2019-05', '2019-04', '2019-03',

       '2019-02', '2019-01', '2018-12', '2018-11', '2018-10', '2018-09'],

      dtype=object)

一：操作单表

销售额

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

df.head()

打印结果



    日期	转化率	访客数	三级类目	客单价	品牌	销售额

0	2019-08	0.036466	837	滑雪衣	3887.646034	品牌-5	118657.898127

1	2019-08	0.006110	9951	滑雪衣	1890.920192	品牌-7	114977.898920

2	2019-08	0.008279	11067	滑雪衣	1001.541028	品牌-19	91761.540049

3	2019-08	0.003647	25296	滑雪衣	986.192182	品牌-17	90969.935091

4	2019-08	0.006012	5053	滑雪衣	2818.957816	品牌-14	85634.834594

二：汇总销售额

# 汇总销售额

df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

df_sum.head()

打印结果

    品牌	销售额

0	品牌-1	5.479539e+06

1	品牌-10	2.913271e+06

2	品牌-11	2.298716e+06

3	品牌-12	2.821199e+06

4	品牌-13	3.256508e+06

添加行业标签

# 添加行业标签

df_sum['行业'] = name.replace('.xlsx','')

df_sum.head()

打印结果

    品牌	销售额	行业

0	品牌-1	5.479539e+06	户外服装&滑雪衣

1	品牌-10	2.913271e+06	户外服装&滑雪衣

2	品牌-11	2.298716e+06	户外服装&滑雪衣

3	品牌-12	2.821199e+06	户外服装&滑雪衣

4	品牌-13	3.256508e+06	户外服装&滑雪衣

三：操作所有表格

import time

start = time.time()

result = pd.DataFrame()

for name in os.listdir():

    df = pd.read_excel(name)

    df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

    df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

    df_sum['行业标签'] = name.replace('.xlsx','')

    result = pd.concat([result,df_sum])

final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False)

end = time.time()

print('操作用时:{}s'.format(end-start))

操作用时:6.295360088348389s

# 将科学计算法，改为两位小数

pd.set_option('display.float_format', lambda x :'%.2f' % x)

print(final.head())

final.describe()

打印结果

     品牌           销售额

15   品牌-5 1226223640.73

8   品牌-17 1195280571.60

2   品牌-11 1151829215.73

4   品牌-13 1150687029.66

3   品牌-12 1143519788.23

    销售额

count	20.00

mean	1084854125.76

std	63774592.90

min	979272391.61

25%	1050719265.66

50%	1071804742.94

75%	1118990465.22

max	1226223640.73

七：数据分析模型

# 表格处理示例：销售榜品牌及销售额

import pandas as pd

import numpy as np

import os

import time

os.chdir('F:\\50mat\源数据1000张表格')

name = '户外服装&滑雪衣.xlsx'

df = pd.read_excel(name)

result = pd.DataFrame()

for name in os.listdir():

    df = pd.read_excel(name)

    df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

    df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

    df_sum['行业标签'] = name.replace('.xlsx','')

    result = pd.concat([result,df_sum])

final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False)

# 将科学计算法，改为两位小数

pd.set_option('display.float_format', lambda x :'%.2f' % x)

print(final.head(10))

加油:一只阿木木

示例python 批量操作excel统计销售榜品牌及销售额的更多相关文章

使用Python处理Excel文件的一些代码示例
笔记:使用Python处理Excel文件的一些代码示例,以下代码来自于<Python数据分析基础>一书,有删改 #!/usr/bin/env python3 # 导入读取Excel文件的库 ...
python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图
python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图 # coding=utf-8 from openpyxl import load_workbook ...
python制作简单excel统计报表2之操作excel的模块openpyxl简单用法
python制作简单excel统计报表2之操作excel的模块openpyxl简单用法 # coding=utf-8 from openpyxl import Workbook, load_workb ...
Python导出Excel为Lua/Json/Xml实例教程（二）：xlrd初体验
Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验相关链接: Python导出Excel为Lua/Json/Xml实例教程(一):初识Python Python导出E ...
python操作excel表格(xlrd/xlwt)
最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的"研究&q ...
Python处理Excel（转载）
1. Python 操作 Excel 的函数库我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都 ...
python处理Excel - xlrd xlwr openpyxl
python处理Excel - xlrd xlwr openpyxl 1 xlrd和xlwt Todo: 使用xlrd和xlwt读写Excel文件的方法和示例代码,待续... 参考链接: Creati ...
【转】python操作excel表格(xlrd/xlwt)
[转]python操作excel表格(xlrd/xlwt) 最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异, ...
Python实现代码统计工具——终极加速篇
Python实现代码统计工具--终极加速篇声明本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对 ...
Python 利用Python操作excel表格之xlwt介绍
利用Python操作excel表格之xlwt介绍 by:授客 QQ:1033553122 直接上代码案例1 #!/usr/bin/env python # -*- coding:utf-8 ...

随机推荐

SpringBoot的知识点总结和常用注解
SpringBoot 知识点总结基础入门基本介绍.基本特性.核心模块.版本选择.环境要求.安装集成.技快速开发接口.Maven Wrapper.Spring Boot CLl 配置管理配置类.配 ...
VUE商城项目 -登录功能 - 手稿
用户列表功能开发
洛谷P2864
来一发在洛谷的第一篇题解解析首先从原点出发回到原点会形成一个环要计算在环上的路程,首先我们要破环利用建墙法破环可以选取任意一个边缘上的树,往上或者往下或者往左往右建立一堵墙'|' 这样利用b ...
如何在有数BI中实现千人千面的数据推送？
问题背景前几天有个项目管理的同学来咨询我一个问题,该项目有一个项目进度信息表,表中有项目名称,项目阶段,项目状态,项目任务等字段,在实际工作中想要实现如下场景: 当项目名称为A时,且项目阶段是需求阶 ...
WebGL实践之半透阴影
楔子相信很多人都知道,通过ShadowMap可以产生阴影,通过渲染阴影可以增加场景渲染的对比度,增加渲染的真实效果. 如下图所示: 但是对于透明或者半透明的对象,WebGL在处理阴影效果的时候,会把 ...
Webpack3.x升级至 4.x 小记
近期项目部署遇到点问题,需要升级webpack版本,特此整理一小记,记录升级过程中的依赖包及报错处理. 本次升级的依赖包及对应版本对照表: npm 包当前版本升级版本 S/D vue ^2.5.1 ...
[项目自荐] 交叉编译njs并使用Nginx搭建自由的个人网盘：vList5
这个博客好久没有打理了,最近才想起来这篇文章是以下 5 篇文章的组合,希望这个免费的项目能实现他的初衷吧 vList5:部署指南 vList5.3 全面加密,从我做起 njs 从入门(交叉编译)到入 ...
[oeasy]python0094_视频游戏_双人网球_pong_atari_mos_6502_雅达利_米洛华
编码进化回忆上次内容上次我们回顾了微软之前的比尔盖茨和保罗艾伦 mits 迎来的是帮手还是隐患? intel-8080 遇到了 mos-6502 底层硬件驱动游戏行业进化不光是扑克 ...
JavaScript小面试~节流
节流,当用户发出多次请求时,需要对事件进行限制,不要让事件过多触发.场景:在用户浏览页面的时候,用户拼命滚动屏幕时,控制页面滚动的事件会多次触发,会导致网络阻塞或者出现渲染差.此时需要对其进行约束.无 ...
2024NOI联合省选游记
人生当中成功只是一时的,而失败却是主旋律. 不太好的的阅读体验本文作者:xxxalq 所谓游记,顾名思义就是指游玩所记,所以重点在玩而不在省选. 由于没有参加 \(\text{NOIP}\),导致我 ...

示例python 批量操作excel统计销售榜品牌及销售额

示例统计销售榜品牌及销售额

示例python 批量操作excel统计销售榜品牌及销售额的更多相关文章

随机推荐

热门专题