示例python 批量操作excel统计销售榜品牌及销售额
示例统计销售榜品牌及销售额
import pandas as pd
import numpy as np
import os os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx'
df = pd.read_excel(name)
df.head()
打印结果
日期 转化率 访客数 三级类目 客单价 品牌
0 2019-08 0.036466 837 滑雪衣 3887.646034 品牌-5
1 2019-08 0.006110 9951 滑雪衣 1890.920192 品牌-7
2 2019-08 0.008279 11067 滑雪衣 1001.541028 品牌-19
3 2019-08 0.003647 25296 滑雪衣 986.192182 品牌-17
4 2019-08 0.006012 5053 滑雪衣 2818.957816 品牌-14
df['日期'].unique()
打印结果
array(['2019-08', '2019-07', '2019-06', '2019-05', '2019-04', '2019-03',
'2019-02', '2019-01', '2018-12', '2018-11', '2018-10', '2018-09'],
dtype=object)
一:操作单表
销售额
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价'] df.head()
打印结果
日期 转化率 访客数 三级类目 客单价 品牌 销售额
0 2019-08 0.036466 837 滑雪衣 3887.646034 品牌-5 118657.898127
1 2019-08 0.006110 9951 滑雪衣 1890.920192 品牌-7 114977.898920
2 2019-08 0.008279 11067 滑雪衣 1001.541028 品牌-19 91761.540049
3 2019-08 0.003647 25296 滑雪衣 986.192182 品牌-17 90969.935091
4 2019-08 0.006012 5053 滑雪衣 2818.957816 品牌-14 85634.834594
二:汇总销售额
# 汇总销售额
df_sum = df.groupby('品牌')['销售额'].sum().reset_index()
df_sum.head()
打印结果
品牌 销售额
0 品牌-1 5.479539e+06
1 品牌-10 2.913271e+06
2 品牌-11 2.298716e+06
3 品牌-12 2.821199e+06
4 品牌-13 3.256508e+06
添加行业标签
# 添加行业标签
df_sum['行业'] = name.replace('.xlsx','') df_sum.head()
打印结果
品牌 销售额 行业
0 品牌-1 5.479539e+06 户外服装&滑雪衣
1 品牌-10 2.913271e+06 户外服装&滑雪衣
2 品牌-11 2.298716e+06 户外服装&滑雪衣
3 品牌-12 2.821199e+06 户外服装&滑雪衣
4 品牌-13 3.256508e+06 户外服装&滑雪衣
三:操作所有表格
import time start = time.time() result = pd.DataFrame() for name in os.listdir():
df = pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum = df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','') result = pd.concat([result,df_sum]) final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False) end = time.time() print('操作用时:{}s'.format(end-start))
操作用时:6.295360088348389s
# 将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' % x) print(final.head())
final.describe()
打印结果
品牌 销售额
15 品牌-5 1226223640.73
8 品牌-17 1195280571.60
2 品牌-11 1151829215.73
4 品牌-13 1150687029.66
3 品牌-12 1143519788.23
销售额
count 20.00
mean 1084854125.76
std 63774592.90
min 979272391.61
25% 1050719265.66
50% 1071804742.94
75% 1118990465.22
max 1226223640.73
七:数据分析模型
# 表格处理示例:销售榜品牌及销售额 import pandas as pd
import numpy as np
import os
import time
os.chdir('F:\\50mat\源数据1000张表格') name = '户外服装&滑雪衣.xlsx'
df = pd.read_excel(name) result = pd.DataFrame() for name in os.listdir():
df = pd.read_excel(name)
df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']
df_sum = df.groupby('品牌')['销售额'].sum().reset_index()
df_sum['行业标签'] = name.replace('.xlsx','') result = pd.concat([result,df_sum]) final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending = False) # 将科学计算法,改为两位小数
pd.set_option('display.float_format', lambda x :'%.2f' % x) print(final.head(10))
加油:一只阿木木
示例python 批量操作excel统计销售榜品牌及销售额的更多相关文章
- 使用Python处理Excel文件的一些代码示例
笔记:使用Python处理Excel文件的一些代码示例,以下代码来自于<Python数据分析基础>一书,有删改 #!/usr/bin/env python3 # 导入读取Excel文件的库 ...
- python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图
python制作简单excel统计报表3之将mysql数据库中的数据导入excel模板并生成统计图 # coding=utf-8 from openpyxl import load_workbook ...
- python制作简单excel统计报表2之操作excel的模块openpyxl简单用法
python制作简单excel统计报表2之操作excel的模块openpyxl简单用法 # coding=utf-8 from openpyxl import Workbook, load_workb ...
- Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验
Python导出Excel为Lua/Json/Xml实例教程(二):xlrd初体验 相关链接: Python导出Excel为Lua/Json/Xml实例教程(一):初识Python Python导出E ...
- python操作excel表格(xlrd/xlwt)
最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的"研究&q ...
- Python处理Excel(转载)
1. Python 操作 Excel 的函数库 我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都 ...
- python处理Excel - xlrd xlwr openpyxl
python处理Excel - xlrd xlwr openpyxl 1 xlrd和xlwt Todo: 使用xlrd和xlwt读写Excel文件的方法和示例代码,待续... 参考链接: Creati ...
- 【转】python操作excel表格(xlrd/xlwt)
[转]python操作excel表格(xlrd/xlwt) 最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异, ...
- Python实现代码统计工具——终极加速篇
Python实现代码统计工具--终极加速篇 声明 本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对 ...
- Python 利用Python操作excel表格之xlwt介绍
利用Python操作excel表格之xlwt介绍 by:授客 QQ:1033553122 直接上代码 案例1 #!/usr/bin/env python # -*- coding:utf-8 ...
随机推荐
- Java List对象分组
实体类 必须重写equals和hashCode方法 package com.zcsoft.rc.backend.biz.vo.securityLibary; import java.util.Date ...
- 载均衡技术全解析:Pulsar 分布式系统的最佳实践
背景 Pulsar 有提供一个查询 Broker 负载的接口: /** * Get load for this broker. * * @return * @throws PulsarAdminExc ...
- oeasy教您玩转vim - 51 - # 读写文件
读写文件 回忆上节课内容 命令行的光标控制 方向键️️️️️可以控制左右移动 shift+️️️️️按照word左右移动光标 ctrl+b 到开头begin ctrl+e 到结尾end ctrl+w ...
- 常见的SQL数值型数据处理函数
在数据驱动的时代,SQL 已成为数据分析和管理中不可或缺的工具.无论是处理简单的查询还是复杂的数据分析,SQL 都能帮助我们高效地完成任务. 然而,在处理数值型数据时,你是否感到过困惑,不知道如何运用 ...
- ABC361
A link 先输出前\(k\)个,再输出\(x\),最后输出后面的. 点击查看代码 #include<bits/stdc++.h> using namespace std; int n, ...
- C++命名空间、标准输入输出、引用
1.简述C++中命名空间的作用. 答:避免重复定义全局变量的问题. 2.定义两个命名空间A 和 B 分别在A中和B中定义变量value.在main函数中将两个空间的value打印出来. #includ ...
- java程序设计期末复习总结&复盘
java复习 java的特点:简单.面向对象.可移植.跨平台.分布式.多线程.稳定安全.高性能 一个数组可以存放许多不同类型的数值. (F) StringBuffer类是线程安全的,StringBui ...
- Python报错:performance hint: av/logging.pyx:232:5: the GIL to be acquired
参考: https://stackoverflow.com/questions/77410272/problems-installing-python-av-in-windows-11 https:/ ...
- python进程绑定CPU的一些Demo
从https://www.cnblogs.com/devilmaycry812839668/p/17066212.html中知道如何对python进程设置CPU绑定,本文对此进行一些延伸,给出一些例子 ...
- ubuntu环境下boost库的安装——Could NOT find Boost (missing: Boost_INCLUDE_DIR program_options) (Required is at least version "1.49.0")
在Ubuntu环境下使用cmake编译软件,报错,提示信息: Could NOT find Boost (missing: Boost_INCLUDE_DIR program_options) (Re ...