示例统计销售榜品牌及销售额

import pandas as pd
import numpy as np
import os os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx'
df = pd.read_excel(name)
df.head()

打印结果

    日期	转化率	访客数	三级类目	客单价	品牌
0 2019-08 0.036466 837 滑雪衣 3887.646034 品牌-5
1 2019-08 0.006110 9951 滑雪衣 1890.920192 品牌-7
2 2019-08 0.008279 11067 滑雪衣 1001.541028 品牌-19
3 2019-08 0.003647 25296 滑雪衣 986.192182 品牌-17
4 2019-08 0.006012 5053 滑雪衣 2818.957816 品牌-14

df['日期'].unique()

打印结果

array(['2019-08', '2019-07', '2019-06', '2019-05', '2019-04', '2019-03',
'2019-02', '2019-01', '2018-12', '2018-11', '2018-10', '2018-09'],
dtype=object)

一:操作单表

销售额

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

df.head()

打印结果


日期 转化率 访客数 三级类目 客单价 品牌 销售额
0 2019-08 0.036466 837 滑雪衣 3887.646034 品牌-5 118657.898127
1 2019-08 0.006110 9951 滑雪衣 1890.920192 品牌-7 114977.898920
2 2019-08 0.008279 11067 滑雪衣 1001.541028 品牌-19 91761.540049
3 2019-08 0.003647 25296 滑雪衣 986.192182 品牌-17 90969.935091
4 2019-08 0.006012 5053 滑雪衣 2818.957816 品牌-14 85634.834594

二:汇总销售额

# 汇总销售额

df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

df_sum.head()

打印结果

    品牌	销售额
0 品牌-1 5.479539e+06
1 品牌-10 2.913271e+06
2 品牌-11 2.298716e+06
3 品牌-12 2.821199e+06
4 品牌-13 3.256508e+06

添加行业标签

# 添加行业标签
df_sum['行业'] = name.replace('.xlsx','') df_sum.head()

打印结果

    品牌	销售额	行业
0 品牌-1 5.479539e+06 户外服装&滑雪衣
1 品牌-10 2.913271e+06 户外服装&滑雪衣
2 品牌-11 2.298716e+06 户外服装&滑雪衣
3 品牌-12 2.821199e+06 户外服装&滑雪衣
4 品牌-13 3.256508e+06 户外服装&滑雪衣

三:操作所有表格

import time

start = time.time()

result = pd.DataFrame()

for name in os.listdir():
df = pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum = df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','') result = pd.concat([result,df_sum]) final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False) end = time.time() print('操作用时:{}s'.format(end-start))

操作用时:6.295360088348389s

# 将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' % x) print(final.head())
final.describe()

打印结果

     品牌           销售额
15 品牌-5 1226223640.73
8 品牌-17 1195280571.60
2 品牌-11 1151829215.73
4 品牌-13 1150687029.66
3 品牌-12 1143519788.23 销售额
count 20.00
mean 1084854125.76
std 63774592.90
min 979272391.61
25% 1050719265.66
50% 1071804742.94
75% 1118990465.22
max 1226223640.73

七:数据分析模型

# 表格处理示例:销售榜品牌及销售额

import pandas as pd
import numpy as np
import os
import time
os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx'
df = pd.read_excel(name) result = pd.DataFrame() for name in os.listdir():
df = pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum = df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','') result = pd.concat([result,df_sum]) final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False) # 将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' % x) print(final.head(10))

加油:一只阿木木

示例python 批量操作excel统计销售榜品牌及销售额的更多相关文章

  1. 使用Python处理Excel文件的一些代码示例

    笔记:使用Python处理Excel文件的一些代码示例,以下代码来自于<Python数据分析基础>一书,有删改 #!/usr/bin/env python3 # 导入读取Excel文件的库 ...

  2. python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图

    python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图 # coding=utf-8 from openpyxl import load_workbook ...

  3. python制作简单excel统计报表2之操作excel的模块openpyxl简单用法

    python制作简单excel统计报表2之操作excel的模块openpyxl简单用法 # coding=utf-8 from openpyxl import Workbook, load_workb ...

  4. Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验

    Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验 相关链接: Python导出Excel为Lua/Json/Xml实例教程(一):初识Python Python导出E ...

  5. python操作excel表格(xlrd/xlwt)

    最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的"研究&q ...

  6. Python处理Excel(转载)

    1. Python 操作 Excel 的函数库 我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都 ...

  7. python处理Excel - xlrd xlwr openpyxl

    python处理Excel - xlrd xlwr openpyxl 1 xlrd和xlwt Todo: 使用xlrd和xlwt读写Excel文件的方法和示例代码,待续... 参考链接: Creati ...

  8. 【转】python操作excel表格(xlrd/xlwt)

    [转]python操作excel表格(xlrd/xlwt) 最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异, ...

  9. Python实现代码统计工具——终极加速篇

    Python实现代码统计工具--终极加速篇 声明 本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对 ...

  10. Python 利用Python操作excel表格之xlwt介绍

    利用Python操作excel表格之xlwt介绍   by:授客 QQ:1033553122 直接上代码   案例1 #!/usr/bin/env python # -*- coding:utf-8 ...

随机推荐

  1. h5使用js拉起微信支付

    近期,业务需求对接了微信支付,做个总结.web网页想要拉起微信支付,有两种方法: H5下单支付 , JSAPI支付 .首先纯前端做不了微信支付,必须配合后端才能通过微信的下单请求.接下来说说这两种方法 ...

  2. SwiftUI学习01-基本使用

    SwiftUI 是苹果推出的一种现代化方式,用于创建跨所有 Apple 平台的用户界面.它通过声明性语法简化了 UI 的开发流程.下面是一个基本的 SwiftUI 示例,展示了如何使用 SwiftUI ...

  3. UE4 蓝图查找Actor和Actor标签

    在用UE4 开发数字孪生应用的过程中,有很多业务会涉及到actor的查找,和actor标签的使用. 比如下面的场景中,找出所有的物联网设备进行标注. 通过类查找actor 通过类查找actor,可以查 ...

  4. webgl(threejs)生成房间楼层

    楔子 在很多数字孪生项目中,都会涉及到楼层的建模.楼层的建模由于结构繁多,如果都是建模师进行手动建模,工作量会比较大.而楼层本身的结构,可以抽象成可以通过路径构造的对象(这和之前的文章提及的的管路以及 ...

  5. [oeasy]python0128_unicode_字符集_character_set_八卦_星座

    unicode 回忆上次内容 中国的简体和繁体汉字 字符数量都超级大 彼此还认对方为乱码   如果有一种编码所有的字符都能编进去就好了 中日韩(CJK) 欧洲拼音 梵文 阿拉伯文 卢恩字符 等等等都包 ...

  6. oeasy教您玩转linux 010216 随机诗词 fortunezh

    我们来回顾一下 上一部分我们都讲了什么? 下载fortune 输出重定向到cowsay 多重输出重定向 fortune的细节 有没有中️文的fortune呢 # 搜索一下fortune apt sea ...

  7. 洛谷P10693

    洛谷P10693 好奇怪的题目编号 思路提取 input 11 2 13 4 5 3 7 9 9 11 11 12 output 9 以人造数据为例. 首先我们让\(i\)\(\to\)\(a_i\) ...

  8. DASCTF 2023六月挑战赛|二进制专项 PWN (下)

    DASCTF 2023六月挑战赛|二进制专项 PWN (下) 1.can_you_find_me 检查保护 意料之中 64位ida逆向 只有add,和del功能不能show 先看add吧 最多申请10 ...

  9. Python 实现行为驱动开发 (BDD) 自动化测试详解

    ​ 在当今的软件开发领域,行为驱动开发(Behavior Driven Development,BDD)作为一种新兴的测试方法,逐渐受到越来越多开发者的关注和青睐.Python作为一门功能强大且易于使 ...

  10. scratch打乒乓球源码免费下载

    点击下载