数据分析 - sql 业务相关练习题
数据库

userinfo , orderinfo 表
两个 userId 彼此对应
题目

解题
不同月份的下单人数

用户在同一个月份会下多个单,这里进行去重
未支付的脏数据去除
统计用户三月份的回购率和复购率
复购率 - 一个月内重复购买的人数占比

先将所有 3月份购买超过一次的进行统计,然后在和全部数据比对
回购率 - 下个月又重复购买的人数占比
回购率可以使用计算出4月份购买的人数, 然后再用3月份的 in 判断是否再 4月份进行操作
这样操作较为繁琐人工,可以试图用更好用的方式

使用连表之后判断延后一个月进行统计,
统计男女用户的消费频次是否有差异

第一步先把性别为空的脏数据清除
然后连表将订单和用户信息链接, 然后统计每一个用户分别是男女消费了多少订单
然后统合统计总量按照性别分组计算平均消费笔数, 可见男女差异不大
统计多次消费用户, 第一次和最后一次的间隔多少

分组后的数据自然会有最大最小, 直接取出来然后时间插值计算即可,
可以再封装一次来计算平均频率等等操作分析
统计不同年龄段, 用户消费金额是否有差异

先去除部分脏数据,把年龄过筛一下, 默认值很多是按照 1901年计算, 从那个时间点往后卡
年龄的计算直接按照当前时间来减去即可
区分年龄段的方式可以使用 case when 或者直接这样除以然后配合 ceil 向上取整
计算出来年龄端相关的数据之后再统合按照年龄端分组进行分析
可以看出年龄对消费金额还是有影响的, 当然70岁以上的数据肯定还是有脏数据
统计消费28法则, 消费 top20%用户, 贡献多少额度

用比较讨巧的方法, 先算出总和的金额以及总和的人数
然后记住这两个数字
之后使用 limit 提取出排序后的 前 20% 的人在计算总金额,
然后和之前算出来的所有人的总金额比对即可得出比例再 85%左右

ps
mysql 里面是没有 row_number 这样的支持分组排名的函数的 , 因此只能这样较为麻烦的操作
数据分析 - sql 业务相关练习题的更多相关文章
- SQL Server相关书籍
SQL Server相关书籍 (排名不分先后) Microsoft SQL Server 企业级平台管理实践 SQL Server 2008数据库技术内幕 SQL Server性能调优实战 SQL S ...
- atitit.短信 验证码 破解 v3 p34 识别 绕过 系统方案规划----业务相关方案 手机验证码 .doc
atitit.短信 验证码 破解 v3 p34 识别 绕过 系统方案规划----业务相关方案 手机验证码 .doc 1. 手机短信验证码 vs 图片验证码 安全性(破解成本)确实要高一些1 1 ...
- [20190329]探究sql语句相关mutexes补充2.txt
[20190329]探究sql语句相关mutexes补充2.txt --//昨天测试sql语句相关mutexes,看看如果出现多个子光标的情况. 1.环境:SCOTT@book> @ ver1P ...
- [20190328]简单探究sql语句相关mutexes.txt
[20190328]简单探究sql语句相关mutexes.txt --//摘要:http://www.askmaclean.com/archives/understanding-oracle-mute ...
- 捷信达会员管理系统SQL语句相关
捷信达会员管理系统SQL语句相关 USE gshis GO SET ANSI_NULLS, QUOTED_IDENTIFIER ON GO /***************************** ...
- sql与SQL CODE和SQL State相关报错
操作数据库过程中,遇到许多问题,很多都与SQL CODE和SQL State相关,现在把一个完整的SQLCODE和SQLState错误信息和相关解释作以下说明,一来可以自己参考,对DB2错误自行找出原 ...
- SQL业务审核与优化
审核 什么是业务审核 类似与code review 评审业务Schema和SQL设计 偏重关注性能 是业务优化的主要入口之一 审核提前发现问题,进行优化 上 ...
- mybatis 动态sql表达式相关应用
一.mybatis 表达式简介 对于mybatis3 ,提供了一种动态sql的方式.通过动态sql我们可以直接在mybatis 的xm映射文件中直接通过条件判断的方式进行查询添加的拼接.mybatis ...
- SQL注入相关的知识【Mysql为例子】
以DVWA的sql注入初级为例,结合网上搜索的相关利用方式,总结成这一篇文章,内容会有点跳跃. 大纲: 1.初级手工注入 2.order by的使用 3.union查询注意点 4.Mysql相关的注释 ...
随机推荐
- javascript实现Html Table数据表分页
直接调用: <style type="text/css"> th { font-size:18px; ...
- Flutter——Wrap组件(流式布局)
Wrap 可以实现流布局,单行的 Wrap 跟 Row 表现几乎一致,单列的 Wrap 则跟 Row 表现几乎一致.但 Row 与 Column 都是单行单列的,Wrap 则突破了这个限制,mainA ...
- 【异常】java.sql.SQLException: Could not retrieve transaction read-only status from server Query
1 详细异常 java.sql.SQLException: Could not retrieve transaction read-only status , ], [ChargingOrderRea ...
- 03 WIndows编程——手绘函数调用过程
源码 #include<Windows.h> #include<stdio.h> int MessageBoxPrint(char *szFormat, ...); int W ...
- [Agile][Scrum][敏捷开发][DevOps中的持续性测试]一些相关流程的梳理
结合相关资料,做一下梳理 1. 所有的计划任务都是从任务看板(backlog)开始 从backlog中可以看到燃尽图(burndown Chart)来监控项目的进度情况 一个好的看板能够清晰的观测到当 ...
- APP中的第三方“支付”功能测试建议
目前市场上APP中带有支付功能的产品有非常多,那么APP中带有第三方支付功能的产品在这一模块该如何测试才尽可能的确保测试完整性. 正常流程: 正常使用支付宝.微信.银行卡(目前使用最多的第三方支付方式 ...
- python3 Pandas
一.Pandas 1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,主要用于数据处理(数据整理,操作,存储,读取等) 2.http://pa ...
- C语言博客I作业04
问题 回答 这个作业属于那个课程 C语言程序设计II 这个作业要求在哪里 作业要求 我在这个课程的目标是 掌握使用for循环语句实现指定次数的循环程序设计. 这个作业在那个具体方面帮助我实现目标 通过 ...
- 题解 [ZJOI2010]基站选址
题解 [ZJOI2010]基站选址 题面 解析 首先考虑一个暴力的DP, 设\(f[i][k]\)表示第\(k\)个基站设在第\(i\)个村庄,且不考虑后面的村庄的最小费用. 那么有\(f[i][k] ...
- Codeforces Round #571 (Div. 2)
A. Vus the Cossack and a Contest 签. #include <bits/stdc++.h> using namespace std; int main() { ...