Python根据主播直播时间段判定订单销售额归属
写在前面:最近在群里看到一个这样的直播电商的场景觉得还是挺有趣的,于是就想用Python来实现。
需求描述:根据主播直播时间段结合销售订单的付款时间判断所属销售的归属

生成主播在线直播时间段数据
from datetime import datetime, timedelta
import random
import pandas as pd def generate_live_data(start_time, live_duration, anchors, num_repeats=4):
"""
生成直播数据。 参数:
start_time (datetime): 直播开始时间。
live_duration (timedelta): 直播时长。
anchors (list): 主播列表。
num_repeats (int): 每个主播重复直播的次数,默认为 4。 返回:
DataFrame: 包含生成的直播数据的 DataFrame,每行包括开始时间、结束时间和主播。
"""
live_data = []
current_time = start_time
for anchor in anchors:
for _ in range(num_repeats): # 每人直播指定次数
end_time = current_time + live_duration # 计算直播结束时间
live_data.append((current_time, end_time, anchor))
current_time = end_time # 将列表转换为 DataFrame
df = pd.DataFrame(live_data, columns=["Start Time", "End Time", "Anchor"])
return df # 定义开始时间
start_time = datetime(2024, 4, 11, 0, 0) # 2024年4月11日凌晨 # 定义直播时长
live_duration = timedelta(hours=3) # 每人直播三小时 # 定义主播列表
anchors = ["Anchor 1", "Anchor 2", "Anchor 3", "Anchor 4"] # 生成直播数据
live_data_df = generate_live_data(start_time, live_duration, anchors) # 将数据写出到 Excel 文件
excel_file_path = "live_data.xlsx"
live_data_df.to_excel(excel_file_path, index=False)
主播数据展示

生成销售订单数据
import pandas as pd
from datetime import datetime, timedelta
import random def generate_purchase_data(start_time, end_time, time_interval, customers, products):
"""
生成模拟购买数据,并导出到 Excel 文件。 参数:
start_time (datetime): 数据开始时间。
end_time (datetime): 数据结束时间。
time_interval (timedelta): 时间间隔。
customers (list): 模拟客户姓名列表。
products (list): 模拟商品列表。 返回:
str: 导出的 Excel 文件路径。
"""
# 生成时间列表
time_list = []
current_time = start_time
while current_time < end_time:
time_list.append(current_time)
current_time += time_interval # 生成模拟购买数据
purchase_data = []
for time in time_list:
for customer in customers:
product = random.choice(products) # 随机选择一个商品
quantity = random.randint(1, 5) # 随机生成购买数量
purchase_data.append((time, customer, product, quantity)) # 将购买数据转换为 DataFrame
df = pd.DataFrame(purchase_data, columns=["Time", "Customer", "Product", "Quantity"]) # 导出到 Excel 文件
excel_file = "purchase_data.xlsx"
df.to_excel(excel_file, index=False) return excel_file # 定义开始时间和结束时间
start_time = datetime(2024, 4, 11, 0, 0) # 2024年4月11日凌晨
end_time = datetime(2024, 4, 13, 0, 0) # 2024年4月12日凌晨 # 定义时间间隔
time_interval = timedelta(minutes=30) # 每隔半小时 # 定义模拟的客户姓名列表和商品列表
customers = ["Alice", "Bob", "Charlie", "David", "Emma"]
products = ["Product A", "Product B", "Product C", "Product D", "Product E"] # 生成购买数据并导出到 Excel 文件
excel_file_path = generate_purchase_data(start_time, end_time, time_interval, customers, products) print("数据已成功导出到 Excel 文件:", excel_file_path)
销售订单数据展示

根据销售数据匹配主播直播时间段并保存到Excel文件
有时候我们需要根据销售数据来匹配主播的直播时间段,以便进行更深入的分析。
1. 导入必要的模块
import pandas as pd
from datetime import datetime
2. 从Excel文件中读取销售数据和主播直播时间数据
# 从Excel文件中读取销售数据
sales_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\purchase_data.xlsx") # 将时间列转换为datetime类型
sales_data['Time'] = pd.to_datetime(sales_data['Time']) # 从Excel文件中读取主播直播时间数据
anchor_time_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\live_data.xlsx") # 将时间列转换为datetime类型
anchor_time_data['Start Time'] = pd.to_datetime(anchor_time_data['Start Time'])
anchor_time_data['End Time'] = pd.to_datetime(anchor_time_data['End Time'])
3. 初始化结果列表并遍历销售数据
# 初始化一个空列表,用于存储结果
result = [] # 遍历销售数据,判断每笔销售属于哪个主播的直播时间段
for index, row in sales_data.iterrows():
sale_time = row['Time']
customer = row['Customer']
product = row['Product']
quantity = row['Quantity'] # 判断销售时间在哪个主播的直播时间段内
for _, anchor_row in anchor_time_data.iterrows():
start_time = anchor_row['Start Time']
end_time = anchor_row['End Time']
anchor = anchor_row['Anchor'] if start_time <= sale_time <= end_time:
result.append((start_time, end_time, anchor,sale_time, customer, product, quantity))
break
4. 将结果转换为DataFrame并保存到Excel文件
# 将结果转换为DataFrame
result_df = pd.DataFrame(result, columns=['Start Time', 'End Time', 'Anchor','sale_time', 'Customer', 'Product', 'Quantity']) # 将结果保存到Excel文件
excel_file_path = "live_data2.xlsx"
result_df.to_excel(excel_file_path, index=False)
5.完整代码
import pandas as pd
from datetime import datetime # 从Excel文件中读取销售数据
sales_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\purchase_data.xlsx") # 将时间列转换为datetime类型
sales_data['Time'] = pd.to_datetime(sales_data['Time']) # 从Excel文件中读取主播直播时间数据
anchor_time_data = pd.read_excel("C:\\Users\\Administrator\\Desktop\\live_data.xlsx") # 将时间列转换为datetime类型
anchor_time_data['Start Time'] = pd.to_datetime(anchor_time_data['Start Time'])
anchor_time_data['End Time'] = pd.to_datetime(anchor_time_data['End Time']) # 初始化一个空列表,用于存储结果
result = [] # 遍历销售数据,判断每笔销售属于哪个主播的直播时间段
for index, row in sales_data.iterrows():
sale_time = row['Time']
customer = row['Customer']
product = row['Product']
quantity = row['Quantity'] # 判断销售时间在哪个主播的直播时间段内
for _, anchor_row in anchor_time_data.iterrows():
start_time = anchor_row['Start Time']
end_time = anchor_row['End Time']
anchor = anchor_row['Anchor'] if start_time <= sale_time <= end_time:
result.append((start_time, end_time, anchor,sale_time, customer, product, quantity))
break # 将结果转换为DataFrame
result_df = pd.DataFrame(result, columns=['Start Time', 'End Time', 'Anchor','sale_time', 'Customer', 'Product', 'Quantity']) # 打印结果
print(result_df) excel_file_path = "live_data2.xlsx"
result_df.to_excel(excel_file_path, index=False)
Python根据主播直播时间段判定订单销售额归属的更多相关文章
- 虎牙数万主播同时在线直播的秘密,CDN推流日志上行实时监控
6 月 10 日,又拍云 Open Talk | 2018 音视频技术沙龙·深圳站 顺利落幕,来自虎牙的直播运维研发架构师张波在沙龙上做了<基于CDN推流日志的主播上行实时监控及其自动化解密&g ...
- 使用Python自带的库和正则表达式爬取熊猫直播主播观看人气
主要是体现代码的规范性 from urllib import request import re class Spider(): url = 'https://www.panda.tv/cate/lo ...
- 每个大主播都是满屏弹幕,怎么做到的?Python实战无限刷弹幕!
anmu 是一个开源的直播平台弹幕接口,使用他没什么基础的你也可以轻松的操作各平台弹幕.使用不到三十行代码,你就可以使用Python基于弹幕进一步开发.支持斗鱼.熊猫.战旗.全民.Bilibili多平 ...
- 自从用python写了个自动弹幕脚本后,各大主播都来找我,净赚十万!
大家好,今天又给大家带来了Python爬虫的分享,今天我们继续上次的问题,继续来研究一下虎牙平台的爬虫. 起因 写完上次的代码,我冒出有一个很有趣的想法,就是,我们可以使用selenium来完成虎牙自 ...
- python爬虫--看看虎牙女主播中谁颜值最高
目录 爬虫 百度人脸识别接口 效果演示 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知 ...
- Python开发:一个直播弹幕机器人诞生过程,自动发送弹幕
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬取B站弹幕视频讲解 https://www.bilibili.com/vide ...
- 记录一下自己爬虎牙LOL主播的爬虫思路
1.明确爬虫目的 爬虫目的需要我们明确的,没有目的的爬虫都是耍流氓!像我这次爬虫目的能不能从网页上爬下来. 2.怎么来爬? a. 先要找到具有唯一性的标签 <li class="gam ...
- 鹅厂优文|主播pk,如何实现无缝切换?
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文作者,rexchang(常青),腾讯视频云终端技术总监,2008 年毕业加入腾讯,一直从事客户端研发相关工作,先后参与过 PC QQ.手 ...
- 90后外挂开发者:已经有许多主播在我这里在外挂,我月入50W
绝地求生上线不到一年已经火爆全球,玩家们表示再差的优化也抵挡不住我们玩游戏的热情,近日,各大平台主播糯米油条五五开等人的开挂实锤闹得沸沸扬扬,玩家之间刮起了一阵反击外挂的风暴. 俗话说得好,没有买卖就 ...
- 『Scrapy』爬取斗鱼主播头像
分析目标 爬取的是斗鱼主播头像,示范使用的URL似乎是个移动接口(下文有提到),理由是网页主页属于动态页面,爬取难度陡升,当然爬取斗鱼主播头像这么恶趣味的事也不是我的兴趣...... 目标URL如下, ...
随机推荐
- 建立两台linux主机的ssh信任,实现ssh免密登录远程服务器
1.介绍 假设我们现在有AB两个服务器,要求A能够远程登录到B服务. CentOS版本:CentOS Linux release 7.6.1810 (Core) 2.实操 1.先在A服务上输入以下命令 ...
- dnsmasq 本地局域网DNS服务器搭建
项目背景 因为本地环境需要使用域名进行调试,需要DNS服务器 DNS 机器IP:192.168.5.249 dnsmasq 服务端部署 #01 关闭防火墙 systemctl stop firew ...
- .npmrc 项目的 默认安装配置
.npmrc registry=http://192.168.77.105:8081/nexus/content/groups/npm-all/
- vscode 自动格式化md文件,搞得很是郁闷,加入 [markdown] 自定义配置 "editor.formatOnSave": false 搞定了。
上下文: vscode做vue的项目开发,需要对代码进行格式化,用的vetur插件 正常来讲,代码保存的时候,需要进行格式化,所以配置文件会写成 "editor.formatOnSave&q ...
- C++实现一个简单的生产者-消费者队列
本文的代码都是ChatGPT生成,我只是做了微小的调整和整合,AI提示词如下: 设计一个C++类,支持生产者-消费者模型,可以通过size函数获取剩余数量 可能第一次生成的不一定合适,多刷新几次. 生 ...
- Window资源管理器插件增强,可显示Android的apk图标
身为Android开发人员,更习惯看到apk的图标,但是windows系统默认不支持显示pak图标,找了会插件,终于是找到了 安装 下载软件压缩包,下载地址:https://stars-one.lan ...
- python学习笔记(3):模块
模块 一个.py文件就是一个模块,模块可以包含在包(package)内.包内必须有一个__init**__**.py,包也可以多层嵌套.__init__.py也是一个模块,模块名就是包名. 当用命令行 ...
- 安装centos系统必做操作
关闭SELinux sed -i '/^SELINUX=/c SELINUX=disabled' /etc/selinux/config 在Linux系统中临时关闭SELinux(Security-E ...
- 引领汽车营销新趋势,3DCAT实时云渲染助力汽车三维可视化
当前,汽车产业发展正从电动化的上半场,向智能化的下半场迈进.除了车机技术体验的智能化之外,观车体验的智能化也不容忽视. 这是因为,随着数字化.智能化.个性化的趋势,消费者对汽车的需求和期待也越来越高, ...
- 【面试】将 95% 求职者拒之门外的BAT大数据面试题-附解题方法(文末有福利)
写在前面 最近不少读者找我要大数据面试题,我整理了很久,筛选出这10道容易出错的大数据面试题,希望对大家有所帮助.题目与解答整理自互联网,感谢分享这些面经的技术大牛们! 题目概览 如何从大量的 URL ...